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内 容 提 要 
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了 如 何 通过 推论 统计 学 来 理解 事物 的 运作 方式 ， 发 现 变量 之 间 的 相关 性 ， 以 及 透 过 局 部 样本 分 析 推 断 出 总 
体 特征 ， 做 出 异常 精准 的 预测 。 

本 书 适 合 从 事 数据 统计 、 分 析 工 作 或 对 统计 分 析 感 兴趣 的 读者 。 
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统计 学 作为 一 种 解决 问题 的 方法 已 经 传授 了 几 百 年 。 在 最 初 的 几 个 世纪 , 统计 学 只 是 一 套数 
学 法 则 , 用 于 确定 某 些 事情 发 生 的 可 能 性 。 其 中 绝 大 部 分 法 则 都 是 具有 数学 天 赋 的 人 为 了 赌钱 时 
稳 赚 不 赔 而 想 出 来 的 。 有 时 候 ， 他 们 会 与 别人 分 享 自己 的 发 现 ,估计 那 时 候 他 们 的 钱 已 经 多 得 花 
不 完 , 得 考虑 捐 给 慈善 机 构 了 。 在 最 近 大 约 150 年, 统计 学 的 范畴 不 断 扩 充 , 已 经 包括 了 根据 样 
本 数据 准确 推断 总 体 数 据 特征 的 方法 。 使 用 样本 来 描述 整体 属于 推论 统计 学 的 范畴 。 推论 统计 学 
是 统计 学 花园 中 绝 美 的 花 朱 。 

统计 学 的 发 展 日 新 月 异 。 目 前 统计 学 的 主要 应 用 是 解决 日 常生 活 中 的 难题 。 市面 上 的 统计 学 
参考 书 虽 然 也 致力 于 解决 这 些 难 题 ， 比 如 推论 统计 学 如 何 检 验 假设 ,如何 回 答 研 究 问 题 , 但 很 少 
探讨 如 何 更 有 趣 、 更 好 玩 地 运用 统计 学 。 我 希望 通过 本 书 改变 这 一 现状 。 

本 书 由 很 多 Hack 组 成 。 每 个 Hack 都 会 用 一 种 聪明 的 方法 解决 一 个 有 意思 的 问题 。 这 些 问 题 
涉及 如 何 用 统计 学 来 回答 日 常 难题 、 语 得 比赛 、 赢 到 钱 (向 500 年 前 的 先辈 们 致敬 )， 我 会 把 自 
己 能 想到 的 所 有 方法 毫 无 保留 地 教 给 你 。 此 外 , 本 书 也 涉及 指导 研究 的 传统 统计 学 方法 ， 你 会 看 
到 有 关 检 验 和 多 次 回归 的 Hack， 和 擎 握 了 本 书 的 技艺 后 ， 你 就 能 在 扑 殉 牌 游戏 中 获胜 ， 破 解 秘 窗 
数据 ， 比 超人 更 加 聪明 。 你 还 能 学 会 自己 解决 遇 到 的 问题 。 比 如 ,“8 是 你 的 幸运 数字 吗 ? ”“ 裸 
婚 能 收获 笠 福 的 概率 有 多 大 ? ”设计 你 自己 的 Hack 来 揭 开 这 些 问题 的 谜底 吧 ! 

希望 本 书 能 给 你 带 来 愉悦 的 体验 ! 祝 你 好 运 ! 





















































Bruce Frey 博士 
2014 年 3 月 


Preface for Chinese Edition of Statistics Hacks 


Statistics has been taught as a way of solving problems for many 100’s of years. For the first few 
centuries of the field, statistics was simply a set of mathematical rules for determining the likelihood of 


something happening. Most of those rules were developed by smart mathematicians who wanted to make 
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money gambling. Occasionally they would share their discoveries with others, perhaps when they were 
wealthy enough to give to charity. For the last 150 years or so, statistics has expanded to include methods 
of using a small sample of information to make fairly accurate guesses about a larger body of information. 
Using a sample to describe the larger population it represents is inferential statistics. And inferential 


statistics is the beauty of statistics. 


Another more recent change is occurring in the field of statistics. The focus now ls to apply statistics 
to everyday problems. While textbooks have long included many applied problems as examples of how 
inferential statistics can test hypotheses and answer research questions, few discuss the more interesting 


and fun ways to use statistics! [hope to change that with this book. 


This book is full of different “hacks”. A hack is a clever way to solve an interesting problem. Tve 
included all the ways I can think of to use statistics to answer everyday problems, to win games, and (in 
honor of our ancestors from 500 years ago) to win money. Oh, there are a few traditional discussions of 
statistical ways to conduct research and you’ll see hacks about t tests and multiple regression (whatever 
those are), but you’l] also find out how to win at poker, decode secret messages, and how to be smarter 
than Superman. And you’ll develop skills to answer your own interesting problems. Is 8 your lucky 
number? What are the chances that a marriage that started with a “naked” wedding will be successful? 


Find out by designing your own hacks! 
I hope you’ll enjoy this book! Best wishes! 


Bruce Frey, Ph.D. March, 2014 
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为 本 书 做 出 贡献 的 人 


下 面 这 些 人 为 本 书 贡献 了 自己 的 智慧 ， 他 们 为 我 写作 本 书 提供 了 素材 和 灵感 。 

口 约瑟夫 阿 德 勒 (Joseph Adler ) 是 Baseball Facks (O'Reilly 出 版 ) 一 书 的 作者 ， 在 VeriSign 
公司 的 高 级 产品 研发 小 组 担任 研究 员 , 专注 于 用 户 认证 、 管 理 安全 服务 和 RFID 安全 方面 
的 问题 。 约 瑟 夫 曾 任 DoubleClick、 美 国 捷 运 公司 和 Dun & Bradstreet 等 公司 雇员 和 咨询 顾 
问 ， 他 有 着 多 年 分 析 数 据 、 构 建 统 计 模 型 和 制定 业务 策略 的 经 验 。 他 毕业 于 麻 省 理工 学 
院 ， 获 得 计算 机 科学 学 士 学 位 和 计算 机 工程 硕士 学 位 。 约 瑟 夫 是 全 美 职业 棒球 大 联盟 纽 
约 洋 基 队 的 一 位 忠实 球迷 ， 但 他 也 欣赏 所 有 精彩 的 棒球 比赛 。 约 瑟 夫 和 他 的 妻子 住 在 硅 
谷 ， 他 们 养 了 两 只 猫 ， 家 中 装 有 DirecTV 的 卫星 天 线 。 

口 罗 恩 . 黑 尔 - 埃 文 斯 (Ron Hale-Evans ) 是 一 名 作家 、 思 想 家 和 游戏 设计 师 。 作 为 一 名 技 
术 作 家 ， 他 通过 频繁 的 演出 谋生 。 他 拥有 耶鲁 大 学 心理 学 学 十 学位， 大 学 期 间 还 辅修 了 哲 
学 。 对 思维 的 很 多 思考 促使 他 创建 了 Mentat Wiki ( http://www.ludism.org/mentat )， 他 也 因 
此 在 最 近 写 了 《心理 和 脑 与 生活 》( Mind Performance Hacks, OReilly 出 版 )。 你 可 以 在 他 
的 主页 http://ron.ludism.org 上 找到 他 五 花 八 门 的 (他 自己 就 是 这 么 写 的 ) 其 他 项 目 ， 包 括 

他 获奖 的 棋盘 游戏 、 以 及 他 的 博客 。 罗 恩 的 下 一 本 书 可 能 是 关于 游戏 系统 的 ， 尤 其 是 因为 

他 给 非常 热爱 但 已 停刊 的 《游戏 杂志 》( The Games Journal，http:/www.thegamesjournal.com ) 
所 写 的 关于 这 个 话题 的 一 系列 文章 ， 在 玩家 和 学 者 中 一 直 非 常 受 欢迎 。 如 果 你 想 通 过 电 
子 邮件 给 罗 恩 发 送 一 些 容易 上 当 受 骗 的 出 版 商 的 名 字 ， 或 者 如 果 你 只 是 想 偷偷 地 知道 他 
在 想 什 么 ， 你 可 以 通过 rwhe@ludism.org 联系 他 (ludism 和 nudism 押韵 ， 但 和 Luddism 
无 关 )。 

口 布雷 恩 . E. 汉 森 (BrainE.Hansen，27 岁 ， 在 得 克 萨 斯 州 达拉斯 地 区 长 大 。 在 西班牙 为 宗 
教 使 命 服务 两 年 后 ， 他 进入 得 克 萨 斯 州 农工 大 学 学 习 并 于 2004 年 毕业 ， 获 石油 工程 理学 
学 士 学 位 。 目 前 ， 他 在 一 家 总 部 位 于 得 克 萨 斯 州 欧文 市 的 大 型 独立 石油 和 天 然 气 勘探 生 
产 公司 担任 油 藏 工程 师 。 
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口 吉尔 … H. 罗 米 尔 〈J H. Lohmeier ) 拥有 马萨诸塞 大 学 阿 默 斯 特 分 校 认 知心 理学 博士 学 位 。 
她 目前 在 堪萨斯 大 学 担任 学 校 课程 评价 和 研究 小 组 的 评估 负责 人 。 吉 和 尔 喜欢 户外 运动 ， 
尤其 是 跑步 、 徒 步 旅行 以 及 和 她 的 孩子 们 中 足球 。 

口 欧 内 斯 特 .了 .罗斯 曼 ( ErnestE. Rothman ) 是 罗 得 马 州 纽 波 特 沙 尔 瓦 瑞金 纳 大 学 (SRU ) 
的 数学 科学 系 教授 兼 系 主任 。 欧 内 斯 特 拥 有 布朗 大 学 应 用 数学 博士 学 位 ， 在 来 沙 尔 瓦 . 瑞 
金 纳 大 学 (SRU ) 之 前 ， 他 在 纽约 康 奈 尔 理论 中 心 任职 。 他 的 兴趣 主要 是 科学 计算 、 数 
学 和 统计 学 教育 ,以 及 Mac OSX 的 基础 操作 系统 Unix。 你 可 以 在 http://homepage.mac.com/ 
samchops 上 随时 了 解 他 的 最 新 动态 。 

口 尼 尔 .J 萨 尔 金 德 (NeilJ. Salkind ) 曾经 任教 于 堪萨斯 大 学 ， 办公 室 在 布鲁斯 弗 雷 对 面 ， 
布鲁斯 : 弗 雷 享有 统计 黑客 的 声誉 。 尼 尔 除 了 是 Statistics for Peoples Who(Think They)Hate 
Statistics( S4GE ) 一 书 的 作者 ， 还 是 一 名 收集 图 书 、 会 做 饭 、 会 修理 老 房 子 、 驾 驶 沃 尔 
沃 P1800 的 发 展 心理 学 家 ， 他 还 经 常 参 加 游泳 大 师 赛 。 此 外 ， 他 还 写 了 100 多 本 关于 贸 
易 的 书 和 教材 ， 并 且 经 常 与 纽约 的 StudioB 文学 出 版 社 合作 。 

口 威廉 . 斯 科 朗 普 斯 基 ( William Skorupski ) 现任 堪萨斯 大 学 教育 学 院 助 理 教授 ， 教 授 心理 
测量 学 和 统计 学 课程 。2000 年 , 他 从 巴克 内 尔 大 学 取得 教育 研究 和 心理 学 学 十 学 位 ; 2004 
年 ， 他 在 马萨诸塞 大 学 阿 默 斯 特 分校 取 得 心理 测量 方法 博士 学 位 。 他 的 主要 研究 兴趣 是 
将 数学 模型 应 用 于 数据 的 心理 测量 ， 包 括 使 用 贝 叶 斯 统计 来 解决 实际 测量 问题 。 他 还 嘉 
欢 将 自己 的 统计 学 和 概率 知识 应 用 于 日 常生 活 ， 比 如 和 本 书 作 者 打 扑 克 ! 
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Langdon )， 他 给 我 送 了 一 本 哈里 : 布 拉 克 史 东 (Harry Blackstone Jr ) 写 的 There% One Born Every 
Minute( Jove 出 版 ) 平装 本 ， 这 本 书 对 本 书 中 的 很 多 技巧 有 极 大 的 局 发。 
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开阔 ， 对 什么 是 Hack 什么 不 是 Hack 了 然 于 胸 。 他 大 多 数 时 候 都 是 对 的 。( 虽然 不 是 每 次 都 对 : 如 
何 利用 猴子 选择 肯塔基 州 大 赛马 的 赢家 本 该 作为 Hack 出 现在 本 书 里 。 也 许 下 次 可 以 将 此 收录 进 
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前 


无 论 你 察觉 与 否 ， 几 率 都 在 你 生活 中 扮演 着 极其 重要 的 角色 。 你 个 人 独特 的 基因 组 成 , 在 生 
命 孕育 之 初 即 有 些微 的 突变 , 而 这 些 突变 是 基于 特定 的 概率 法 则 而 发 生 的 。 你 的 在 校 成 绩 也 会 涉 
及 某 些 人 为 误差 一 一 这 可 能 是 你 自己 造成 的 , 也 可 能 是 其 他 人 造成 的 ,以 致 你 的 实际 能 力 水 平 无 
法 准确 地 反映 在 成 绩 报告 单 或 利害 似 关 的 测试 中 。 职业 生涯 研究 甚至 表明 , 你 的 谋生 之 道 可 能 并 
不 是 精心 规划 和 准备 的 结果 ， 而 更 有 可 能 受到 偶然 事件 的 操控 。 当 然 , 在 几率 游戏 中 你 的 命运 完 
全 取决 于 几率 ; 几率 对 体育 赛事 的 结果 亦 有 着 极其 重要 的 影响 。 

幸好 , 我们 现 有 一 整套 科学 工具 ， 即 形形色色 的 统计 应 用 程序 , 用 以 解决 所 谓 的 “命运 影响 
体系 ”引起 的 诸多 问题 。 推 论 统 计 学 (inferential statistics ) 是 一 门 完全 基于 概率 本 质 的 统计 科学 ， 
不 仅 能 让 我 们 理解 事物 的 运作 方式 , 发 现 变量 之 间 的 相关 性 , 还 可 透 过 局 部 样本 分 析 推 断 出 总 体 

寺 征 ， 做 出 异常 精准 的 预测 一 一 没 错 ， 或 许 你 已 经 想到 ， 我 们 其 至 偶尔 可 以 通过 推算 出 的 概率 ， 
适当 下 注 来 赚 些 小 钱 。 

本 书 集合 了 诸多 统计 技巧 和 应 用 工具 。 书 中 不 仅 蝇 括 了 统计 学 工具 ,还 介绍 了 教育 学 、 心 理 
测量 及 实验 研究 设计 等 方面 极 具 实用 价值 的 工具 , 为 社会 学 以 及 商务 、 游 戏 和 博彩 领域 遇 到 的 各 
种 相关 问题 提供 了 解决 方案 。 

倘若 你 是 位 顶尖 科学 家 ,睡梦 中 都 在 做 统计 运算 ， 相 信 你 会 发 觉 此 书 趣味 良 多 ， 它 为 你 熟知 
的 那些 锈 迹 斑 斑 的 旧 工 具 找 到 许多 充满 创意 的 应 用 方法 。 倘 若 你 只 是 在 日 常生 活 中 喜欢 科学 探 
讨 , 以 发 掘 奇 绝 的 点 子 和 巧 解 有 趣 的 问题 为 乐 , 那 你 也 大 可 放心 : 本 书 并 非 以 纯 学 术 式 思维 编写 ， 
你 若 觉 得 自己 属于 后 一 类 人 ,那么 这 本 书 恰 是 你 的 不 二 之 选 。 本 书 也 不 是 专门 写 给 统计 学 家 看 的 ， 
所 以 ， 哪 怕 你 是 统计 学 的 门外汉 ， 也 照样 能 读 出 趣味 。 

男 一 方面 ， 如 果 你 选修 了 统计 课程 , 或 对 学 术 性 话题 感 兴趣 ,那么 你 会 发 现 这 本 书 是 此 类 课 
程 常 用 教科 书 的 知音 加 伴 倡 , 你 的 教科 书 与 本 书 之 间 不 存在 任何 相悖 之 处 ， 了解 一 些 貌 似 纯 理 论 
性 的 统计 学 工具 在 现实 中 的 应 用 ,并 不 会 妨 但 你 的 发 展 。 事实 上 , 你 可 以 运用 统计 学 去 做 许多 非 
和 常 酷 的 事情 ， 这 更 像 是 一 种 娱乐 而 不 仅 是 单纯 的 工作 。 























































































































































































































xvi 前 言 


为 什么 称 作 Hack 


Hacking 一 词 在 传媒 界 声名 狼藉 。 它 一 般 用 来 指称 那些 以 电脑 作为 武器 ,侵入 或 破坏 他 人 电 
脑 系统 的 人 。 人 然而， 在 专业 程序 员 的 圈子 里 ，Hack 是 指 以 “非常 规 的 快捷 方式 ”解决 问题 或 者 
巧妙 完成 某 件 事 的 方案 。 在 这 一 语 境 中 , Hacker 一 词 便 颇具 赞赏 之 意 , 通常 指 代 某 些 充满 创造 力 ， 
且 拥 有 特定 技能 ， 能 够 出 色 完 成 任务 的 人 。Hack 系列 丛书 试图 为 Hacker 正名 ,向 正面 意义 上 的 
Hacker 行为 致敬 ， 向 外 行 传递 创造 性 参与 的 Hacker 理念 。 要 知道 ， 观 看 他 人 如 何 动手 操作 系统 
并 解决 问题 往往 是 学 习 一 门 新 技术 的 捷径 。 

本 书 的 技术 核心 是 统计 、 测 量 和 研究 设计 。 计 算 机 技术 的 发 展 向 来 与 这 些 技术 携手 并 进 ， 
此 ， 使 用 Hack 来 表述 书 中 所 要 介绍 的 内 容 恰 好 与 该 词 的 本 意 完全 相符 。 尽 管 书 中 只 有 一 小 部 分 
内 容 涉及 电脑 Hacking， 但 却 介 绍 了 大 量 巧妙 而 有 实效 的 操作 方法 。 
































本 书 的 组 织 结构 

如 果 你 愿意 ， 可 以 从 头 至 尾 阅读 本 书 。 但 鉴于 书 中 所 介绍 的 各 种 Hack 自 成 一 体 ， 阅 读 时 ， 
你 尽 可 随意 浏览 ， 翻 到 自己 最 感 兴趣 的 部 分 去 读 。 若 想 深 入 了 解 某 项 Hack， 还 可 循 着 书 中 的 交 
又 引用 跳 转 查阅 。 

前 面 的 Hack 更 注重 基础 整合 , 通常 会 针对 多 种 多 样 的 问题 提供 广义 的 解决 方案 或 战略 方法 。 
后 面 的 Hack 则 更 趋 具体 化 ， 例 如 提供 更 具 针 对 性 的 技巧 来 帮助 我 们 赢得 游戏 ， 或 者 单纯 提供 信 
息 ， 让 我 们 充分 认识 到 自己 身边 的 情况 。 

全 书 按照 不 同 的 主题 ,分 为 以 下 儿童 。 

第 1 章 基础 知识 

这 部 分 Hack 可 以 作为 一 个 强大 的 基础 工具 合集 ， 在 你 运用 统计 学 Hacking 解决 麻烦 时 会 频 
繁 地 用 到 它们 。 不 妨 将 其 想象 成 一 套 基础 工具 : 它们 是 你 手边 的 锤子 、 锯 子 以 及 不 同 规 格 的 螺丝 刀 。 

第 2 章 ”发现 相关 性 

章 涵 盖 了 用 于 发 现 、 描 述 和 测试 变量 相关 性 的 多 种 统计 方法 。 通 过 这 些 Hack， 你 能 化 不 

可 见 为 可 见 。 

第 3 章 测量 世界 


这 里 为 你 呈现 了 测量 身边 世界 的 大 量 穿 门 和 方法 。 你 将 学 会 如 何 正 确 提问 ， 准 确 估 算 ， 甚 至 












































注 1: The Hack Series 是 一 套 系列 丛书， 除 本 书 外 ， 还 包括 Baseball Hacks、Access Hacks、Mind Hacks 、Excel Hacks 等 几 
部 作品 。 译 者 注 











能 够 提高 你 在 关键 考试 中 的 分 数 。 

第 4 章 逆境 制胜 

本 章 是 写 给 赌场 玩家 的 。 善 用 概率 知识 ， 可 在 得 州 扑克 游戏 中 做 出 正确 决定 。 这 也 同样 适用 
于 其 他 由 概率 定 胜 负 的 游戏 。 

第 5 章 游戏 技巧 

从 “赢得 大 富 公 ”有 奖 电视 游戏 节目 到 只 着 眼 于 娱乐 的 体育 赛事 ,本 章 为 你 呈现 形形色色 的 
Hack， 让 你 成 为 游戏 里 的 最 大 赢家 。 

第 6 章 精明 思 

本 章 可 能 是 所 有 章节 中 最 耗 脑力 的 一 章 。 理 清 轧 路 ， 让 我 们 来 做 脑力 游戏 ,探索 发 现 , 使 用 
本 章 的 Hack 揭 开 周围 世界 的 神秘 面纱 。 









































本 书 排版 约定 


本 书 使 用 的 排版 规范 如 下 所 示 。 
@ 楷体 
用 于 表示 新 的 术语 和 概念 。 
@ 等 宽 字体 
用 于 表示 Excel 函数 和 代码 示例 。 
@ 等 宽 针 体 
用 于 表示 用 户 需 要 根据 自己 提供 的 值 进行 更 换 的 部 分 。 
用 以 下 图 标 标示 的 文字 部 分 读者 要 特别 注意 。 


下 面 三 个 温度 计 图 标 出 现在 每 个 Hack 的 开始 部 分 ， 说明 这 一 主题 的 难 易 程 度 。 














图 标 表示 提示 、 建 议 或 者 一 般 注解 。 这 部 分 内 容 是 对 当前 主题 的 补充 ,很 有 用 。 
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xviii 前 言 





SafarieBooks Online 





Safari Books Online ( http://www.safaribooksonline.com ) 是 应 需 而 变 的 
Sa fa 上。 数字 力 书 馆 。 它 同时 以 图 书 和 视频 的 形式 出 版 世界 项 级 技术 和 商务 作 
Books online 家 的 专业 作品 。 

Safari Books Online 是 技术 专家 、 软 件 开 发 人 员 、Web 设计 师 、 商 务 人 士 和 创意 人 士 开 展 调 
研 、 解 决 问题 、 学 习 和 认证 培训 的 第 一 手 资料 。 

对 于 组 织 团体 、 政 府 机 构 和 个 人 ，Safari Books Online 提供 各 种 产品 组 合 和 灵活 的 定价 策略 。 
用 户 可 通过 一 个 功能 完备 的 数据 库 检 索 系 统 访问 O’Reilly Media 、Prentice Hall Professional、 
Addison-Wesley Professional 、 Microsoft Press 、Sams 、Que Peachpit Press、Focal Press、 Cisco Press、 
John Wiley & Sons、 Syngress、 Morgan Kaufmann、IBM Redbooks 、Packt、Adobe Press、FT Press、 
Apress、 Manning、New Riders、McGraw-Hill 、Jones & Bartlett、Course Technology 以 及 其 他 几 十 
家 出 版 社 的 上 千 种 图 书 、 培 训 视 频 和 正式 出 版 之 前 的 书稿 。 要 了 解 Safari Books Online 的 更 多 信 
息 ， 我们 网 上 见 。 


联系 我 们 
请 把 对 本 书 的 评价 和 发 现 的 问题 发 给 出 版 社 。 


O’Reilly Media, Inc. 

1005 Gravenstein Highway North 

Sebastopol, CA 95472 

中 国 : 

北京 市 西城 区 西直门 南大 街 2 号 成 馈 大 厦 C 座 807 室 (100035 ) 

奥 莱 利 技术 咨询 ( 北京 ) 有 限 公司 

O’Reilly 的 每 一 本 书 都 有 专属 网 页 ， 你 可 以 在 那里 找到 本 书 的 相关 信息 ， 包 括 勘误 表 、 示 例 
代码 以 及 其 他 信息 。 本 书 的 网 址 是 : http://www.oreilly.com/catalog/statisticshks 


对 于 本 书 的 评论 和 技术 性 问题 ， 请 发 送 电子 邮件 到 : 


















































bookquestions(@oreilly.com 
要 了 解 更 多 O'Reilly 图 书 、 培 训 课 程 、 会 议和 新 闻 的 信息 ， 请 访问 以 下 网 站 : 


http://www.oreilly.com 





我 们 在 Facebook 的 地 址 如 下 : http:/facebook.comyoreilly 
请 关注 我 们 的 Twitter 动态 : http://twitter.com/oreillymedia 
我 们 的 YouTube 视频 地 址 如 下 : http:Wwww.youtube.comy/oreillymedia 


参与 进来 
要 了 解 Hacks 系列 图 书 或 者 有 意 撰写 该 系列 图 书 ， 请 访问 以 下 网 站 : 


http://hacks.oreilly.com 


0'Reilly Media, Inc. 介 绍 


O’Reilly Media 通过 图 书 、 杂 志 、 在 线 服务 、 调 查 研究 和 会 议 等 方式 传播 创新 知识 。 自 1978 年 
开始 ，O’Reilly 一 直 都 是 前 沿 发 展 的 见证 者 和 推动 者 。 超 级 极 客 们 正在 开创 着 未 来 ， 而 我 们 关 
注 真正 重要 的 技术 趋势 一 一 通过 放大 那些 “细微 的 信号 ”来 刺激 社会 对 新 科技 的 应 用 。 作 为 技 
术 社 区 中 活跃 的 参与 者 ，O’Reilly 的 发 展 充满 了 对 创新 的 倡导 、 创 造 和 发 扬 光大 。 


O'Reilly 为 软件 开发 人 员 带 来 革命 性 的 “动物 书 ”; 创建 第 一 个 商业 网 站 (GNN) ; 组织 了 影响 
深远 的 开放 源 代码 峰会 ， 以 至 于 开源 软件 运动 以 此 命名 ， 创立 了 Make 杂志 ， 从 而 成 为 DIY 革命 
的 主要 人 先锋， 公司 一 如 既往 地 通过 多 种 形式 缔结 信息 与 人 的 纽带 。O’Reilly 的 会 议和 峰会 集聚 了 
众多 超级 极 客 和 高 瞻 远 瞩 的 商业 领袖 ， 共 同 描绘 出 开创 新 产业 的 革命 性 思想 。 作 为 技术 人 士 获 取 
信息 的 选择 ，O’Reilly 现在 还 将 先锋 专家 的 知识 传递 给 普通 的 计算 机 用 户 。 无 论 是 通过 书籍 出 版 ， 
在 线 服务 或 者 面授 课程 ， 每 一 项 O'Reilly 的 产品 都 反映 了 公司 不 可 动摇 的 理念 一 一 信息 是 激发 创 
新 的 力量 。 
































业界 评论 
“O"Reilly Radar 博客 有 口 宣 碑 。” 
Wired 





“O"Reilly 凭借 一 系列 ( 真希 望 当初 我 也 想到 了 ) 非凡 想法 建立 了 数 百 万 美元 的 业务 。” 


Business 2.0 





“OReilly Conference 是 聚集 关键 思想 领袖 的 绝对 典范 。” 
—CRN 


“一 本 OReilly 的 书 就 代表 一 个 有 用 、 有 前 途 、 需 要 学 习 的 主题 。 


Trish Times 





“Tim 是 位 特 立 独行 的 商人 ， 他 不 光 放 眼 于 最 长 远 、 最 广阔 的 视野 并 且 切 实地 按照 Yogi Berra 的 
建议 去 做 了 :“ 如 果 你 在 路 上 这 到 岔路 口 ， 走 小 路 (岔路 ) ”回顾 过 去 Tim 似乎 每 一 次 都 选择 了 
小 路 ,而且 有 几 次 都 是 一 闪 即 逝 的 机 会 ， 尽管 大 路 也 不 错 。” 
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基础 知识 
( Hack #1~#10 ) 


统计 学 家 用 来 探索 世界 、 回 答 问题 和 解决 难题 的 工具 其 实 并 不 多 ， 关 键 在 于 他 们 利用 概率 
或 者 正 态 分 布 知识 的 方法 ， 让 他 们 能 在 千变万化 的 情境 中 解决 问题 。 本 章 将 为 你 介绍 这 些 基 本 
的 Hack。 
将 已 知 的 分 布 信息 表述 成 概率 [Hack #1], 这 是 统计 黑客 常用 的 基本 技艺 , 与 之 类 似 的 还 有 用 
小 样本 数据 来 准确 描述 数量 较 大 总 体 中 个 体 的 分 值 [Hack #2]。 懂得 计算 概率 [Hack #3] 的 基本 规则 
很 重要 。 此 外 ， 如 果 你 想 基 于 统计 作 决 策 [Hack 的 和 Hack #8]， 必 须 通 晓 显著 性 检验 。 

使 估计 中 的 错误 [Hack #5] 和 得 分 中 的 错误 [Hack #6] 最 小 化 ,正确 地 解释 数据 [Hack #7]， 是 在 
不 同情 境 下 做 到 事半功倍 的 核心 策略 。 成 功 的 统计 黑客 能 够 轻而易举 地 识别 出 任何 有 组 织 观测 的 
结果 或 实验 操作 的 真正 含义 [Hack #9 和 Hack #10]。 

弄 懂 这 些 核心 工具 的 用 法 ， 学 习 和 掌握 后 面 的 Hack 将 变 得 轻而易举 。 














i 区 1.1 不 可 不 知 的 秘密 


统计 学 家 怎么 让 自己 看 起 来 比 其 他 人 聪明 ? 





统计 学 作为 一 种 科学 方法 ,主要 目的 是 对 分 数 样本 做 概率 解释 。 在 深入 学 习 前 , 需要 简单 了 
解 一 些 术 语 ， 以 便 理解 这 个 Hack， 也 为 理解 其 他 Hack 打 下 基础 。 

样本 是 你 目前 收集 到 , 就 摆 在 你 眼前 的 数值 ， 用 来 表示 既 不 在 你 眼前 也 没收 集 到 的 更 大 的 数 
值 总 体 。 因 为 这 些 值 几乎 总 是 用 来 表示 某 一 特征 的 存在 或 程度 的 数字 , 所 以 测量 界 把 这 些 值 称 为 
分 数 。 概 率 解 释 是 对 某 件 事 情 发 生 的 可 能 性 的 解释 。 
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概率 是 统计 学 的 核心 和 灵魂 。 实 际 上 ,对 统计 学 家 的 一 种 普遍 看 法 就 是 , 他 们 主要 计算 某 些 
备 受 关注 的 事情 ( 比如 中 彩票 或 是 被 雷击 ) 发 生 的 精确 可 能 性 。 经 验 告诉 我 们 ， 有 办 法 计算 仍 子 
游戏 结果 可 能 性 的 人 ， 同 样 有 办 法 用 为 数 不 多 的 汇总 统计 数据 来 描述 一 大 群 人 。 

所 以 , 通常 统计 学 的 教学 中 至 少 会 花 点 时 间 来 讲述 概率 的 原理 : 计算 不 同 组 合 的 出 现 概率 或 
者 各 种 可 能 结果 排列 的 方法 。 但 是 , 统计 学 中 更 为 常见 的 是 描述 性 统计 或 是 推断 性 统计 ,前 者 用 
以 描述 分 数 群 组 , 后 者 仅 用 样本 中 包含 的 少量 信息 对 分 数 总 体 进行 估计 。 在 社会 科学 中 , “分数” 
常 被 用 来 描述 人 或 是 发 生 在 人 身上 的 事件 。 

当然 , 研究 人 员 和 测量 人 员 ( 现实 生活 中 最 有 可 能 使 用 统计 的 人 ) 不 局 限于 计算 某 种 组 合 和 
排列 的 可 能 性 。 他 们 根本 不 需要 计算 连续 3 次 扔 一 对 山子 得 到 7 的 概率 , 他 们 能 够 运用 不 同 的 统计 
程序 来 回答 复杂 程度 不 同 的 问题 。 















































> 
7， 就 有 16.6% 的 概率 扔 到 第 三 个 7。 




















概率 对 统计 学 家 的 工作 如 此 重要 ， 关 键 原因 是 他 们 喜欢 对 实际 或 理论 分 布 的 分 数 进行 概率 
解释 。 


刀 分 数 的 分 布 会 列 出 一 系列 不 同 的 值 ， 有 些 情况 下 ， 还 会 给 出 每 个 值 的 数量 。 


比如 ， 假 设 你 知道 刚刚 参加 的 一 次 测验 中 ， 分 数 分 布 是 25% 的 人 得 到 10 分 ， 那 我 可 能 会 说 ， 
我 不 需要 认识 你 ， 也 不 需要 了 解 与 你 有 关 的 任何 情况 ， 就 能 知道 你 有 25% 的 可 能 性 得 到 10 分 。 我 
同样 可 以 说 , 你 有 75% 的 几率 不 得 10 分 。 我 所 做 的 只 是 获得 关于 某 些 值 分 布 的 已 知 信息 ,将 其 表 
述 成 概率 。 这 是 一 种 技巧 , 是 所 有 统计 学 家 都 知道 的 秘密 。 实 际 上 ,这 几乎 是 统计 学 家 们 所 做 的 
一 切 ! 

统计 学 家 获取 关于 某 些 值 分 布 的 已 知 信息 并 将 其 表述 成 概率 。 我 们 有 必要 再 次 强调 这 人 句 话 
(严格 来 说 ， 这 是 第 三 遍 ): 统计 学 家 获取 关于 值 分 布 的 已 知 信息 并 将 其 表述 成 概率 。 

天 啊 ! 这 我 们 都 能 做 到 ! 这 有 何 难 ? 假设 有 一 个 空 咖啡 负 ， 里 面 有 三 个 弹 珠 。 再 假设 你 知道 
其 中 只 有 一 个 弹 珠 是 蓝 色 的 。 现 在 分 布 信息 包含 三 个 值 : 一 个 蓝 色 弹 珠 还 有 另外 两 个 其 他 颜色 的 
弹 珠 ， 这 三 个 值 构成 了 一 个 样本 。 三 个 弹 珠 里 有 一 个 是 蓝 色 。 噢 ， 统 计 学 家 ,， 闭 上 你 的 眼睛 ,请 
问 我 首次 取出 蓝 色 弹 珠 的 几率 是 多 少 ? 1/3。33%。 





















































注 1: 准确 地 讲 应 该 是 1/(6 x 6 x 6)，0.00462963， 约 等 于 0.005。 一 一 译 者 注 
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说 句 公 道 话 ,统计 学 家 最 常用 的 值 及 其 分 布 通常 比 刚才 那个 从 咖啡 经 里 取 弹 珠 的 场景 稍微 复杂 
或 抽象 一 些 , 所 以 统计 学 家 的 工作 看 起 来 不 是 那么 浅显 易 履 。 比 如 , 应 用 社会 科学 领域 的 研究 人 员 
总 是 用 “ 值 ”来 表示 不 同 群 体 平均 分 之 间 的 差异 , 或 者 两 个 或 两 个 以 上 分 数 集 的 关系 度量 。 其 内 在 
过 程 和 刚才 所 举 的 咖啡 缸 的 例子 并 无 不 同 ， 不 过 是 参考 已 知 的 值 分 布 信息 ， 做 出 对 值 的 概率 解释 。 

当然 , 关键 是 怎样 才能 知道 这 些 奇 特 的 、 让 统计 学 家 感 兴趣 的 值 的 分 布 ” 怎样 才能 了 解 平均 
差 的 分 布 或 两 组 变量 间 关 系 程度 的 分 布 ? 方便 的 是 , 研究 人 员 和 数学 家 前 辈 已 经 发 明 或 发 现 了 多 
种 公式 和 定理 、 经 验 法 则 、 思想 体系 和 假说 , 让 我 们 了 解 到 研究 者 最 常用 到 的 复杂 值 的 分 布 情况 。 
这 些 工作 前 人 已 经 为 我 们 做 好 了 。 




















1.1.2 不 太 光 彩 的 小 秘密 


统计 学 家 获得 分 数 分 布 的 已 知 信息 、 将 其 表述 为 概率 的 方法 中 , 多 数 必须 满足 一 些 前 提 , 才能 
够 确保 概率 解释 的 准确 。 其 中 一 个 几乎 永恒 不 变 的 必要 前 提 就 是 : 样本 值 必须 从 分 布 中 随机 抽取 。 

请 注意 ,在 叙述 咖啡 缸 的 例子 时 ,我 插 了 一 句 “ 闭 上 你 的 眼睛 ”。 如 果 抽 样 过 程 不 是 随机 的 ， 
而 是 被 其 他 一 些 因 素 所 引导 , 那么 得 出 的 相应 概率 就 错 了 ; 最 精 糕 的 是 ,我 们 无 法 了 解 错误 的 程 
度 。 现 今 ， 也 许 绝 大 部 分 应 用 心理 学 和 教育 学 研究 都 不 是 随机 采样 的 。 

比如 ， 选 修 《 心 理学 导论 》 课 程 的 大 学 生 ， 构 成 了 很 多 心理 学 研究 的 样本 。 由 于 贪图 便利 ， 
教育 研究 人 员 常 用 自家 附近 的 小 学 生 充 作 样本 。 这 是 社会 科学 研究 者 常常 容忍 、 忽 略 或 担心 的 一 
个 问题 , 但 不 管 怎样 ， 非 随机 抽样 是 很 多 社会 科学 研究 中 存在 的 一 个 局 限 。 






































本 书 介 和 绍 的 大 部 分 统计 解决 方案 和 工具 之 了 所 以 行 之 有 效 , 只 因为 你 能 通过 样本 对 总 体 
进行 精确 推断 。 获 得 以 上 推断 技巧 需要 用 到 的 元 工具 、 主 要 指导 方针 和 所 有 秘密 之 最 
就 是 中 心 极限 宏 理 。 


每 当 你 试图 描述 一 组 分 数 时 , 统计 学 都 能 为 你 提供 解决 方案 。 有 时 你 想 描 述 的 整 组 分 数 全 都 
摆 在 眼前 ,这 时 完成 该 任务 的 方法 称 作 描述 性 统计 。 更 常见 的 情形 是 ,你 只 能 看 到 欲 描 述 的 一 组 
分 数 中 的 一 部 分 ,但 仍 想 描述 整个 组 。 这 种 概括 性 方法 称 作 推断 性 统计 。 在 推断 性 统计 中 ， 你 想 
要 推断 的 整个 分 数 群 组 叫做 总 体 ， 其 中 能 看 到 的 那 一 部 分 叫做 样本 。 

从 定义 上 看 , 不 经 直接 观察 就 能 有 把 握 地 描述 由 多 个 值 构 成 的 总 体 , 想来 颇 似 一 种 奇妙 的 把 
戏 。 然 而 ,你 只 消 运用 三 条 信息 一 一 两 个 样本 值 和 一 个 总 体 分 数 分 布 形态 的 假设 , 便 可 自信 而 准 
确 地 描述 那 不 可 见 的 总 体 ， 其 结果 准 得 令 人 称奇 。 这 样 一 套 推断 程序 就 是 所 谓 的 中 心 极限 定理 。 


1 加 1.2” 仅 用 两 个 数字 描述 世 磺 
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1.2.1 统计 学 基础 一 点 通 

推断 性 统计 用 两 个 值 来 描述 总 体 : 平均 数 和 标准 差 。 

1. 平均 数 

若 要 描述 值 的 样本 , 报告 一 组 分 数 的 合理 概要 比 展示 每 个 分 数 更 高 效 。 这 个 数值 应 该 能 够 代 
表 群 组 中 所 有 分 数 以 及 它们 的 共性 。 因 此 ， 这 个 数值 被 视 为 一 组 分 数 的 趋 中 趋势 。 

由 于 种 种 原因 ， 通 常情 况 下 对 趋 中 趋势 的 最 佳 度量 是 平均 数 [Hack #1]。 平均 数 是 所 有 分 数 
的 算术 平均 ， 即 把 群 组 中 所 有 值 相 加 求 和 并 除 以 群 组 中 值 的 数量 。 相 比 其 他 趋 中 度量 ( 比如 中 位 
数 、 众 数 等 )， 平 均 数 可 以 提供 关于 群 组 分 数 的 更 多 信息 。 

实际 上 ， 从 数学 上 看 , 平均 数 具 有 一 个 有 趣 的 属性 。 其 计算 方式 ( 所 有 分 数 相 加 并 除 以 分 数 
的 数量 ) 所 导致 的 副 效 应 就 是 产生 了 一 个 和 其 他 所 有 分 数 尽 可 能 接近 的 数字 。 这 个 平均 数 会 和 群 
组 中 的 一 些 分 数 比 较 接 近 ， 和 男 一 些 分 数 距 离 较 远 ,。 但 是 如 果 你 将 这 些 距 离 相 加 , 得 到 的 总 数 是 
最 小 的 。 其 他 任何 数字 , 无 论 是 真实 的 还 是 想象 的 ,与 群 组 中 各 个 分 数 的 距离 总 和 都 不 会 比 它 更 


小 。 
































2. 标准 差 

仅仅 知道 某 一 分 布 的 平均 值 还 不 够 , 我 们 还 需要 知道 有 关 分 数 变异 性 的 信息 。 是 多 数 接近 平 
均 数 还 是 多 数 远离 平均 数 ? 两 个 非常 不 同 的 分 布 可 能 有 着 相同 的 平均 数 ， 但 变异 度 却 大 为 不 同 。 
最 常用 的 变异 度量 概括 了 每 个 分 数 和 平均 数 的 距离 。 

像 平 均 数 一 样 ， 承 载 更 多 信息 的 变异 度量 能 用 到 分 布 内 的 所 有 数值 。 标 准 差 就 是 这 样 一 种 
变异 度量 。 标 准 差 是 每 个 分 数 和 平均 数 的 平均 距离 。 它 统计 某 一 分 布 中 所 有 的 距离 并 算出 平均 
值 : 这 里 的 “距离 ”是 每 个 分 数 和 平均 数 的 距离 。 


















































另 一 个 经 常用 于 概括 分 布 变异 性 的 值 是 方差 。 方 差 是 标准 差 的 平方 ,在 描述 单一 分 
布 时 并 不 是 特别 有 用 ， 但 对 比较 不 同 分 布 的 差异 性 很 有 帮助 。 方 差 常用 作 统 计 运 算 
值 ， 比 如 独立 t 检 验 [Hack#17]。 


标准 差 公 式 看 起 来 复杂 得 超出 必要 , 但 求 和 距离 ( 当 平 均 数 被 当做 分 割 点 时 ， 负 向 距离 总 会 
抵消 正 向 距离 ) 在 数学 上 的 确 有 些 复杂 。 故 而 有 以 下 的 方程 式 : 


[这 C= 平 均 数 ) 
1 一 1 


其 中 号 表示 求 和 。x 表 示 每 个 分 数 ，n 表 示 分 数 的 数量 。 
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1.2.2 中心 极限 定理 

中 心 极限 定理 非常 简单 ， 但 非常 强大 。 该 定理 表述 如 下 : 

如 果 你 从 总 体 中 随机 抽取 多 个 样本 ， 那 么 每 一 样本 的 平均 数 趋 于 正 态 分布 。 

由 此 定理 衍生 出 一 系列 的 数学 规则 ， 用 以 准确 估计 上 述 虚 构 的 样本 平均 数 分 布 的 描述 值 。 
口 这 些 平均 数 的 平均 数 ( 念 起 来 真 描 口 ) 等 于 总 体 的 平均 数 。 凭 借 单 样本 的 平均 数 ， 可 对 
平均 数 的 平均 数 做 出 很 好 的 估计 。 
口 这 些 平均 数 的 标准 差 等 于 样本 标准 差 除 以 样本 量 的 平方 根 ( 以 字母 7 表示 ): 

0 


Vn 
样本 集合 内 的 样本 数量 越 大 ， 这 些 数学 规则 产生 的 结果 越 准确 ， 分 布 也 更 接近 于 正 态 曲线 。 














当 样 本 数 为 30 或 30 以 上 时 ， 应 用 中 心 极限 定理 似乎 足以 得 出 准确 结果 。 


1.2.3” 那 又 如 何 


好 吧 , 中 心 极限 定理 看 起 来 有 那么 一 点 儿 智力 趣味 性 , 并 且 毫 无 疑问 能 让 统计 学 家 们 兴奋 不 
已 ， 但 那 又 意味 着 什么 呢 ? 怎样 才能 用 它 来 做 点 酷 酷 的 事 ? 

正如 1.1 节 [Hack #1] 中 讨论 的 ， 这 个 所 有 统计 学 家 都 知道 的 有 效 秘诀 是 : 获取 一 些 值 分 布 的 
已 知 信息 ， 并 将 其 表述 为 概率 解释 。 当 然 ， 关 键 是 怎样 才能 知道 引起 统计 学 家 兴趣 的 不 同类 型 
值 的 分 布 ? 又 该 如 何 得 知 平均 差异 的 分 布 或 是 两 组 变量 关系 大 小 的 分 布 ? 答案 是 : 中 心 极 限 
定理 。 

比如 , 为 了 估计 任何 两 个 群 组 在 某 个 变量 上 出 现 一 定 差异 的 概率 , 我 们 需要 知道 样本 对 应 的 
总 体 平均 数 的 分 布 。 而 当 总 体 平均 数 不 可 见 , 其 至 只 是 理论 存在 时 ， 如何 能 够 了 解 分 布 的 状态 ? 
小 伙 子 , 答案 就 是 中 心 极限 定理 ! 当 样 本 可 能 从 无 限 可 能 相关 性 的 总 体 中 抽取 时 ,如 何 能 够 知道 
相关 性 ( 衡量 两 个 变量 间 相 关 强 度 的 指标 ) 的 分 布 ? 听 说 过 中 心 极限 定理 吗 ， 老 兄 ? 

既 已 知道 正 态 曲线 上 值 的 比例 [Hack #3]， 中 心 极限 定理 又 告诉 我 们 这 些 概 括 性 的 值 为 正 态 
分 布 , 因此 我 能 对 每 个 统计 结果 标 出 概率 。 我 能 在 我 的 结论 和 决策 中 用 这 些 概率 表示 统计 显著 性 
水 平 ( 置信 水 平 )。 如 果 没 有 中 心 极限 定理 ， 我 几乎 无 法 做 出 任何 关于 统计 显著 性 的 解释 。 那 将 
是 何等 乏味 而 悲哀 的 生活 。 
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1.2.4 ”中 心 极限 定理 的 实际 应 用 


该 定理 在 实际 应 用 中 ， 只 需 从 总 体 中 随机 抽取 几 个 样本 值 。 例 如 ， ee 
子 军 。 我 的 职责 是 教会 他 们 打 绳 结 。 我 猜 在 我 指导 过 的 童子 军 学 员 当 中 , 这 一 批 孩子 并 不 是 最 聪 
明 的 。 

在 开口 要 求 增加 学 费 之 前 , 我 想 要 判断 他 们 是 否 真 的 有 点 笨 。 我 想 知道 他 们 的 智商 。 我 知道 
童子 军 的 总 体 平均 智商 是 100, 但 我 注意 到 这 8 个 童子 军 学 员 里 没有 一 个 智商 超过 100 的 。 按理 说 ， 
总 该 有 个 别 超出 这 一 水 平 的 。 这 一 组 人 是 从 平均 总 体 里 刻意 选 出 的 吗 ? 也 许 , 只 是 我 的 样本 有 点 
不 同 ， 并 不 代表 所 有 童子 军 ? 如果 使 用 中 心 极限 定理 的 统计 方法 ， 就 会 提问 道 : 


这 个 样本 所 代表 的 总 体 平均 IQ 可 能 是 100 吗 ? 
如 果 我 想 知道 我 这 组 童子 军 是 从 什么 样 的 整体 中 抽出 来 的 , 可 以 使 用 中 心 极限 定理 相当 准确 
地 估计 总 体 的 平均 IJQ 和 总 体 的 标准 差 。 我 同样 可 以 计算 出 样本 平均 IJQ 和 总 体 平 均 IJQ 有 多 大 差异 。 
我 需要 从 手下 的 童子 军 那 里 获得 一 些 数据 以 便 进行 以 上 计算 。 表 1-1 提 供 了 一 些 不 错 的 信息 。 


表 1-1: 童子 军 聪 明 程 度 





































































































童子 军 IQ 
吉米 100 
佩 里 95 
克拉 克 90 
莱克 斯 92 
尼 尔 85 
比 利 88 
格雷 格 93 
约翰 91 





这 8 个 IQ 分 数 样本 的 描述 性 统计 是 : 

口 平均 IQ=91.75 

口 标准 差 =4.53 

于 是 我 知道 在 我 的 样本 组 中 , 大 部 分 个 体 的 IQ 分 数 在 91. 75 的 45 左右 。 不 过 , 我 更 感 兴趣 的 


是 他 们 所 来 自 的 那个 未 知 的 总 体 。 利 用 中 心 极 限定 理 我 外 ge 好 估计 这 一 总 体 的 平均 数 、 标 准 差 , 更 
重要 的 是 ， 能 估计 样本 平均 数 在 多 大 程度 上 偏离 总 体 平均 数 。 


e@ 平均 IQ 
我 们 的 样本 平均 数 可 作为 最 好 的 估量 依据 ， 所 以 总 体 平均 数 很 可 能 接近 91.75。 








1.3 计算 概率 





@ 总 体 中 IQ 分 数 的 标准 差 
计算 样本 标准 差 的 公式 是 专 为 估计 总 体 标准 差 而 设计 的 ， 所 以 推测 总 体 标准 差 是 4.53。 
@ 平均 数 的 标准 差 
这 才 是 真正 关注 的 值 。 我 们 知道 样本 的 平均 数 小 于 100， 但 那 可 能 是 偶然 的 吗 ?” 当 从 总 体 中 
随机 抽取 这 含有 8 个 数 的 样本 时 ， 样 本 的 平均 数 会 在 多 大 程度 上 偏离 总 体 平均 数 ? 这 里 要 用 到 之 
前 提 过 的 方程 式 。 输 入 样本 值 计 算 平均 数 的 标准 差 ， 这 通常 称 为 平均 数 的 标准 误差 : 
o 453 4.53 


Vn V8 2.83 


由 于 中 心 极限 定理 ,我们 现在 知道 ，8 个 童子 军 中 大 多 数 样 本 的 平均 数 是 在 总 体 平 均 数 上 + 1.6 
个 IQ 点 的 范围 内 。 所 以 ， 这 个 平均 数 为 91.75 的 样本 不 太 可 能 是 从 平均 数 为 100 的 总 体 中 抽取 出 来 
的 。 总 体 平均 数 为 93 或 者 94， 但 不 是 100。 

因为 我 们 知道 这 些 平均 数 是 正 态 分 布 的 ， 所 以 可 以 利用 关于 正 态 分 布 形态 的 知识 [Hack #23] 
来 生成 一 个 精确 的 概率 ， 即 从 平均 数 为 100 的 总 体 中 抽取 出 平均 数 为 91.75 的 样本 的 概率 。 这 种 情 
况 发 生 的 概率 低 于 1/100 000。 看 来 我 手下 这 批 学 习 打 绳 结 的 孩子 要 比 普通 人 难 教 一 些 。 我 也 许可 
以 多 收 一 点 学 费 。 





















































1.60 











1.2.5 ”其 他 生效 领域 

中 心 极限 定理 的 一 个 模糊 版 本 指出 : 

受 很 多 随机 作用 和 无 关 事件 影响 的 数据 最 终 呈 正 态 分 布 。 

因为 这 几乎 适用 于 我 们 度量 的 所 有 事物 , 所 以 可 以 应 用 正 态 分 布 特征 对 多 数 可 见 和 不 可 见 概 
念 做 概率 解释 。 

至 此 , 我 们 还 没有 说 到 中 心 极限 定理 最 厉害 一 条 的 推论 : 无 论 总 体 分 布 形态 如 何 ， 从 总 体 中 
随机 抽取 的 平均 数 均 呈 正 态 分 布 。 好 好 想 想 。 即 便 你 从 中 抽取 样本 的 总 体 不 是 正 态 分 布 的 , 甚至 
走 到 了 正 态 的 反面 ( 就 像 我 的 叔叔 弗兰克 那样 )， 样 本 的 平均 数 仍 会 是 正 态 分 布 。 

这 是 自然 界 相 当 了 不 起 和 便利 的 特征 。 不 管 我 描述 的 总 体 是 正 态 还 是 非 正 态 、 在 地 球 上 还 是 
在 火星 上 ， 这 一 要 诀 始终 有 效 。 












































J 1.3 计算 概率 
l 8 位 我 会 中 彩票 吗 ? 我 会 在 一 天 内 被 雷击 中 又 被 公交 车手 到 吗 ? 我 所 在 的 棒球 队 会 在 
NCAA 锦 标 赛 中 提前 遇 到 仿 我 们 头 疫 的 对 手 哟 ? 统计 学 的 核心 要 点 就 是 判断 事件 发 
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主 的 可 能 性 ,并 回答 诸如 此 类 的 问题 。 计算 概率 的 基本 规则 今 统计 学 家 有 人 能力 预 
测 未 来 。 
本 书 充满 了 有 趣 的 难题 , 都 可 以 通过 绝妙 的 统计 技巧 解决 。 这 些 Hack 中 展示 的 方法 在 不 同情 
境 中 以 不 同方 式 运 用 , 同时 ,这 些 聪明 解决 方案 中 使 用 的 很 多 程序 能 够 起 作用 ， 是 因为 一 个 核心 
的 元 素 : 概率 定律 。 
上 述 定律 是 一 组 简单 、 确 定 的 关键 原理 ， 表 明 概 率 如 何 起 作用 ， 以 及 应 当 如 何 计 算 。 以 下 两 
个 基本 定律 可 被 视 为 一 套 基础 入 门 工 具 ， 就 像 锤 子 和 螺丝 刀 一 样 ， 大 概 足 以 解决 大 多 数 问题 。 
@ 加 法 定律 
几 个 互 斥 事件 中 任何 一 个 发 生 的 概率 是 各 个 事件 发 生 的 概率 之 和 。 
e@ 相 冬 定律 
一 系列 独立 事件 都 发 生 的 概率 是 每 个 独立 事件 概率 的 乘积 。 
有 了 这 两 个 工具 ， 就 足以 回答 日 常生 活 中 大 部 分 关于 “几率 是 多 少 ” 的 问题 。 


























1.3.1 关于 未 来 的 问题 

当 一 个 统计 学 家 说 出 “1/10 的 可 能 性 ”这 类 话 时 ， 他 就 是 对 未 来 进行 了 一 次 预测 。 这 或 许 是 
对 一 系列 永远 都 无 法 检验 的 事件 所 做 的 假设 性 陈述 ,或许 是 对 即将 发 生 的 事件 不 掺 半点 水 分 的 如 
实 解 说 。 不管 是 哪 种 ,他 都 是 在 对 可 能 的 结果 进行 统计 学 解释 ， 所 有 的 统计 学 家 所 说 的 话 都 无 非 
如 此 [Hack #1]。 


























如 果 你 能 够 理解 以 下 表述 ， 那 么 你 就 具有 了 像 统计 黑客 一 样 行动 和 思考 的 必 备 能 
力 :“ 如 果 有 10 件 事情 可 能 要 发 生 ， 并 且 这 10 件 事情 发 生 的 可 能 性 相等 ， 那 么 这 10 
件 事 中 任何 一 件 发 生 的 几率 是 1/10。” 








科学 研究 中 充满 了 可 用 统计 来 回答 的 问题 ， 当 然 , 还 有 概率 定律 的 运用 , 但 在 实验 室 之 外 还 
有 很 多 难题 ， 比 轧 笨 陈旧 的 科学 问题 更 加 重要 的 问题 ， 比 如 山子 游戏 。 假 设 你 是 一 名 业余 赌 徒 ， 
家 里 的 小 孩 想 要 双 新 鞋子 。 你 下 次 掷 出 一 对 般 子 的 值 会 决定 你 的 未 来 。 那 你 也 许 想 知道 他 子 扔 出 
各 种 结果 的 可 能 性 ， 而 且 是 非常 准确 地 知道 这 种 可 能 性 
只 凭 这 两 件 概率 工具 , 就 能 回答 你 可 能 问 到 的 三 类 最 重要 的 概率 问题 。 你 提出 的 问题 很 可 能 
是 以 下 三 种 类 型 之 一 。 
口 下 一 步 出 现 某 个 特定 结果 的 可 能 性 是 多 少 ?” 比如 ， 下 面 会 掷 出 一 个 7 吗 ? 
口 下 一 步 出 现 某 组 结果 的 可 能 性 是 多 少 ? 比如 ， 下 面 会 出 现 7 或 11 吗 ? 






































1.3 计算 概率 9 











口 下 一 步 出 现 一 系列 结果 的 可 能 性 是 多 少 ” 比 如 ， 一 对 没 被 动 过 手脚 的 骨 子 真 的 能 够 整 晚 
都 不 出 现 7 吗 (我 说 的 是 永远 都 不 出 现 ) ? 我 的 意思 是 ， 那 真 的 可 能 吗 ? 可 能 吗 ?1 











概率 术语 

在 谈论 概率 以 及 如 何 计算 概率 前 ， 我 们 需要 学 会 如 何 像 统 计 学 家 一 样 说 话 。 记 得 之 前 的 
“1/10 的 可 能 性 ”这 向 话 吗 ? 针对 “几率 是 多 少 ”的 问题 ， 共 有 三 种 回答 方式 。 

用 百分比 来 表示 

1/10 可 以 表述 成 10%。 

用 概率 来 表示 

在 可 能 性 为 1/110 的 情况 下 ,成 功 概率 就 是 1 比 9， 即 9 分 输 1 分 赢 。 

用 比例 来 表示 

10% 可 以 表述 成 0.10。 从 技术 上 讲 ， 概率 就 该 以 比例 来 表述 ,否则 就 应 当 改 用 其 他 的 名 称 。 











1.3.2 ”特定 结果 发 生 的 可 能 性 


若 你 对 某 件 事 发 生 的 可 能 性 感 兴趣 ,那么 这 里 的 “ 某 件 事 ”可 以 叫做 获胜 事件 (在 游戏 情 
境 中 ), 或 者 只 是 一 个 你 关注 的 结果 (游戏 以 外 的 情境 )。 概率 中 的 主要 原则 是 用 所 关注 的 结 
数 除 以 全 部 结果 的 总 数 。 全 部 结果 的 总 数 有 时 用 大 写 的 S 表 示 (英文 字母 Set 的 首 字 母 ， 代 表 集 
合 )， 各 种 关注 结果 都 用 大 写 的 A 表 示 。( 我 猜 这 可 能 是 因为 A 是 字母 表 里 的 首 字母 ， 我 是 谁 ， 
数学 家 吗 ? ) 

于 是 有 以 下 的 概率 基本 公式 : 















































A 


S 
计算 任何 特定 结果 或 事件 的 几率 , 就 是 要 算出 这 些 结果 的 数量 , 并 算出 所 有 可 能 的 结果 数量 ， 
然后 对 两 者 进行 比较 。 如 果 可 能 的 结果 为 数 很 少 ， 或 者 对 获胜 结果 的 描述 很 简单 ， 仅 包含 单一 事 
件 ， 那么 上 述 方法 大 抵 很 容易 操作 。 
要 回答 一 个 典型 的 扔 骨 子 问 题 , 我 们 可 以 通过 计算 出 两 枚 般 子 点 数 之 和 等 于 期 望 数值 的 组 合 
数量 , 来 计算 下 次 投掷 时 出 现任 何 特定 值 的 几率 。 然 后 ， 用 那个 数 除 以 所 有 可 能 结果 的 总 数 。 两 
个 六 面 仍 子 ， 总 共有 36 种 可 能 的 投掷 结果 。 


比如 ， 共 有 六 种 方式 搓 出 7 (我 提前 偷 看 了 表 1-2 )，6/36=0.167， 所 以 任意 一 次 投掷 中 掷 出 7 
的 几率 约 为 17%。 
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鼎 通过 把 每 个 朋 子 的 总 面 数 相 乘 ， 能 够 计算 出 可 能 投掷 结果 的 总 数 : 6x6-36。 


1.3.3 出现 一 组 结果 的 可 能 性 

如 果 你 对 一 组 特定 结果 发 生 的 可 能 性 感 兴趣 , 但 并 不 关心 具体 发 生 的 是 哪 一 个 , 那么 按照 加 
法 定律 ， 可 以 把 所 有 个 体 概率 相 加 来 计算 总 概率 。 为 了 回答 我 们 的 骨 子 问题 ， 表 1-2 从 “ 玩 山 子 
行 大 运 ”[Hack 至 3] 当 中 引用 了 一 些 信息 ， 以 便 用 比例 表示 掷 出 各 种 结果 的 几率 。 














表 1-2: 独立 般 子 投掷 概率 表 





般 子 投掷 得 数 结果 的 数量 。 概率 
2 1 0.028 
3 之 0.056 
4 3 0.083 
5 4 0.111 
6 5 0.139 
7 6 0.167 
8 9 0.139 
9 4 0.111 
10 3 0.083 
11 2 0.056 
12 1 0.028 
总 数 36 10 








表 1-2 提 供 了 关于 不 同 结果 的 信息 。 比 如 ,有 两 种 不 同 的 方式 掷 出 3`。 两 个 获胜 结果 除 以 所 有 
可 能 的 结果 总 数 36， 得 到 0.056 这 个 比例 。 所 以 ,用 两 个 仍 子 掷 一 次 ,大约 有 6% 的 几率 掷 出 3。 同 
时 也 请 注意 ， 所 有 可 能 事件 的 概率 之 和 正好 为 1.0。 

假设 我 们 必须 掷 出 几 种 结果 中 的 一 种 , 才能 在 赌局 中 获胜 , 那么 让 我 们 运用 加 法 定律 来 查看 
这 种 情况 下 的 获胜 几率 。 比 方 阅 ， 只 要 你 掷 出 了 10、11、12 中 的 任意 一 个 就 能 赢 ， 那 么 我 们 将 这 
三 个 独立 的 概率 相 加 : 














0.083+0.056+0.028=0.167 
你 将 有 大 约 17% 的 概率 掷 出 10 、11 或 者 12 中 任何 一 个 。 此 处 运用 了 加 法 定律 ， 因 为 你 关注 于 
几 个 独立 事件 中 的 任意 一 件 能 和 否 发 生 。 





1.3.4 ”一 系列 结果 发 生 的 可 能 性 
当 概 率 问题 变 为 “是 否 有 若干 件 事情 发 生 ”， 又 将 如 何 ? 当 你 想 知道 一 连 串 特定 事件 是 否 发 




















注 2: 1+2 或 者 2+1。 一 一 译 者 注 


1.4 ”否定 虚无 假设 11 





生 时 ， 这 个 问题 总 是 被 问 到 。 事 件 发 生 的 顺序 通常 不 重要 。 
我 们 依然 使 用 表 1-2 中 的 数据 ， 以 及 之 前 例子 中 的 三 个 值 (10、11、12 )， 就 能 够 计算 特定 事 
件 序列 发 生 的 几率 。 在 给 定 连 掷 三 次 仍 子 的 情况 下 ， 你 连续 掷 得 10、11、12 的 概率 是 多 少 ?” 基于 
乘法 定律 ， 可 将 这 三 个 独立 概率 相 乘 ; 
0.083 x 0.056 x 0.028=0.00013 
这 个 非常 特定 的 结果 不 太 可 能 发 生 , 其 概率 低 于 1%o , 或 者 说 1% 的 1/110。 此 处 用 到 乘法 定律 ， 
因为 你 感 兴趣 的 是 几 个 独立 事件 是 否 都 会 发 生 。 





1.3.5 ”概率 意味 着 什么 


就 本 节 介 绍 的 Hack 而 言 , 概率 即 某 事 发 生 的 可 能 性 。 我 已 将 讨论 限定 在 分 析 可 能 结果 的 背景 
下 ， 这 是 思考 概率 的 一 个 恰当 方法 。 许 多 哲学 家 和 社会 科学 家 花费 很 多 时 间 思 考 各 种 概念 , 诸如 
几率 、 未 来 和 午饭 该 吃 什么 ， 在 他 们 中 间 对 概率 有 两 种 不 同 的 视角 。 

分 析 视 角 。 这 是 认识 概率 的 经 典 视角 , 也 是 数学 家 和 本 条 Hack 所 用 方法 的 视角 。 分 析 视 角 识 
别 所 有 可 能 的 结果 并 计算 获胜 结果 占 所 有 结果 的 比例 。 这 一 比例 就 是 概率 。 

我 们 通过 概率 解释 来 预测 未 来 ， 预 测 的 准确 性 不 太 可 能 被 检验 。 就 像 天 气 预 报 说 有 60% 的 几 
率 下 雨 。 如 果 没 下 雨 ,我 们 就 不 公平 地 说 天 气 预报 错 了 ， 当 然 我 们 并 没有 真正 检验 过 概率 解释 的 
准确 性 。 

相对 频率 视角 。 在 这 种 与 分 析 视 角 对 立 的 视角 框架 下 ,事件 的 概率 是 通过 收集 数据 ， 观 察 实 
际 发 生 了 什么 及 其 发 后 的 频率 来 计算 的 。 如 果 我 们 将 一 对 侃 子 掷 上 1000 次 ， 发 现 出 现 10、11 或 12 
点 的 几率 是 17%， 那 我 们 就 会 说 得 到 这 三 个 值 其 中 一 个 的 几率 约 是 17%。 

我 们 的 陈述 将 是 真正 关于 过 去 的 解释 , 而 不 是 对 将 来 的 预测 。 也许 有 人 会 说 过 去 的 事件 能 够 
对 未 来 提供 很 好 的 参考 ， 但 是 谁 说 得 准 呢 ? ( 那些 对 概率 持 分 析 视 角 的 人 ， 他 们 能 够 确定 。) 


1.4 否定 虚无 假设 
l 放量 实验 科学 家 通过 质疑 向 前 推进 。 
科学 是 个 目标 驱动 的 过 程 , 其 目标 是 构建 一 个 解释 世界 的 知识 体系 。 这 个 知识 体系 由 一 长 串 


的 科学 法 则 、 定 律 以 及 关于 事物 如 何 存 在 与 运转 的 理论 构成 。 实验 科 学 引进 新 的 法 则 和 理论 , 并 
通过 一 系列 逻辑 步 又 对 其 加 以 测试 ， 这 个 测试 过 程 称 作假 设 检验 。 































































































1.4.1 假设 检验 


一 个 假设 是 对 可 检验 世界 做 出 的 一 个 估计 。 比 如 , 我 也 许 会 假设 洗车 导致 下 雨 或 是 假设 进 浴 
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缸 导 致电 话 啊 了 。 在 这 些 假设 中 ， 我 认为 洗车 和 下 雨 之 间或 洗澡 和 电话 啊 铃 之 间 存 在 关联 。 
验证 这 些 假设 是 否 正 确 的 一 个 合理 方式 是 观察 假设 中 的 变量 ( 为 了 听 起 来 更 像 统 计 学 家 , 我 
们 把 这 称 作 收集 数据 )， 看 是 否 存 在 显 在 的 相关 性 。 如 果 数 据 显 示 变 量 间 存在 相关 性 ， 那 么 我 的 
假设 得 到 了 支持 , 我 也 许 有 理由 认为 自己 的 估计 是 正确 的 。 如 果 数 据 没 有 明显 的 相关 性 , 我 也 许 
会 明智 地 开始 怀疑 自己 的 假设 是 否 错误 ,或 是 完全 抛弃 它 。 
科学 家 们 通过 收集 数据 来 检验 假设 时 ， 有 4 种 可 能 的 结果 。 表 1-3 显 示 了 该 决策 制定 过 程 中 的 





























表 1-3: 研究 假设 检验 的 可 能 结果 
































假设 正确 : 事实 的 确 如 此 假设 错误 : 事实 并 非 如 此 
数据 支持 假设 : 接受 假设 A. 正确 的 决策 : 科学 取得 进步 B. 错误 的 决策 : 科学 发 展 受阻 
数据 不 支持 假设 : 抛弃 假设 C. 错误 的 决策 : 该 死 ， 又 失败 了 D. 正 确 的 决策 : 科学 取得 进步 














结果 A 和 DD 可 为 科学 的 知识 体系 添砖加瓦 。 虽 然 A 更 可 能 让 研究 科学 家 激动 不 已 , D 其 实 也 还 




















不 错 。 而 B 和 C 则 是 错误 的 ， 它 们 代表 着 错误 的 信息 ， 只 会 混淆 我 们 对 世界 的 理解 。 





1.4.2 ”统计 假设 检验 


你 可 能 觉得 假设 检验 的 过 程 很 有 道理 , 这 是 一 种 相当 直观 的 方式 , 可 用 来 对 世界 和 身 处 其 中 
的 人 得 出 结论 。 人 们 在 日 常生 活 中 总 是 通过 这 种 假设 检验 来 理解 事情 。 

统计 学 家 也 检验 假设 , 但 针对 的 是 某 些 非常 特定 的 假设 。 首先, 他 们 拥有 代表 样本 值 的 数据 ， 
这 些 样本 是 从 他 们 希望 获得 结论 的 真实 或 理论 总 体 中 抽取 的 。 所 以 , 他 们 的 假设 是 关于 总 体 的 假 
设 。 其 次 ,他 们 通常 预先 假设 所 关注 总 体内 的 不 同 变量 之 间 存 在 某 种 相关 性 。 统 计 学 家 提出 的 研 
究 假 设 通常 是 这 个 样子 的 : 所 关注 总 体 中 变量 X 和 变量 了 之 间 存 在 相关 性 。 

统计 假设 检验 不 同 于 研究 假设 检验 , 统计 学 家 在 假设 检验 结束 时 做 出 的 概率 解释 , 与 研究 假 
设 为 真 的 可 能 性 无 关 。 统 计 学 家 对 研究 假设 为 假 的 可 能 性 做 概率 解释 。 在 技术 上 更 准确 的 表述 为 ， 
统计 学 家 对 与 研究 假设 相反 的 假设 为 真 的 可 能 性 做 出 解释 。 这 个 相反 的 假设 通常 是 关于 变量 间 不 
存在 相关 性 的 假设 ,所 以 叫做 虚无 假设 。 统 计 学 家 提出 的 虚无 假设 通常 是 这 个 样子 的 : 所 关注 总 
体 中 变量 X 和 变量 7 之 间 不 具 相 关 性 。 


研究 假设 和 虚无 假设 涵盖 了 所 有 的 可 能 性 。 变量 间 要 么 存在 相关 性 要 么 不 存在 相关 性 。 本 质 
上 ， 当 必须 从 这 两 种 假设 中 选择 其 一 时 ,声明 一 个 为 假 就 等 于 为 男 一 个 提供 了 支持 。 因 此 从 逻辑 
上 讲 , 虚无 假设 检验 和 之 前 介绍 的 日 常生 活 中 人 们 自然 运用 的 直觉 方法 一 样 有 道理 。 研究 人 员 执 
行 虚无 假设 检验 时 偏好 的 结果 和 表 1-3 中 介绍 的 一 般 假设 检验 方法 略 有 不 同 。 
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如 表 1-4 所 示 ， 统 计 学 家 通常 希望 否定 他 们 的 假设 。 统 计 研究 人 员 通 过 否定 虚无 假设 就 能 
证 实 他 们 的 研究 假设 , 进而 获得 研究 津贴 ， 启 得 诺 贝尔 奖 , 或 许 有 朝 一 日 他 们 的 头像 也 能 印 在 邮 
票 上 。 














表 1-4: 虚无 假设 检验 的 可 能 结果 





虚无 假设 是 正确 的 : 总 体 中 存在 相关 性 ”虚无 假设 是 错误 的 : 总 体 中 不 存在 相关 性 
































数据 支持 虚无 假设 : 无 法 拒绝 | A. 正确 的 决策 : 科学 取得 进步 B. 错误 的 决策 : 科学 进步 受阻 
虚无 假设 

数据 不 支持 虚无 假设 : 拒绝 虚 | C. 错误 的 决策 : 该 死 ， 又 失败 了 D. 正确 的 决策 : 科学 取得 进步 
无 假设 








尽管 结果 A 在 科学 角度 上 是 可 以 接受 的 ,但 在 这 种 情境 下 结果 D 更 令 研 究 人 员 高 兴 ， 因 为 该 
结果 支持 了 他 们 关于 世界 的 真实 推测 ， 即 研究 假设 。 和 上 面 一 样 ， 结 果 B 和 结果 C 仍 然 是 有 碍 于 
科学 进步 的 错误 。 








1.4.3 ”生效 原理 


统计 学 家 检验 虚无 假设 一 一 估计 希望 找到 的 结果 的 反面 ,这么 做 有 几 个 原因 。 首 先 , 证 明 某 
件 事 为 真 的 确 非常 非常 难 , 尤其 是 当 假设 中 包含 了 特定 值 时 ,这 在 统计 学 研究 里 是 很 常见 的 。 证 
明 一 个 特定 的 估计 不 正确 要 比 证 实 它 正 确 容易 得 多 。 例 如 , 我 无 法 证 明 我 今年 29 岁 , 但 要 证 明 我 
今年 不 是 29 岁 却 相当 容易 。 


同样 ， 要 证 明 某 个 特定 的 总 体 估 计 值 不 可 能 正确 , 也 相对 容易 一 些 。 大 多 数 统计 中 的 虚无 假 
设 都 假定 总 体 的 值 为 0 ( 也 就 是 说 ， 总 体 中 变量 X 和 变量 7 之 间 不 具 相 关 性 )， 要 拒绝 虚无 假设 就 
是 去 证 明 : 不 论 总 体 的 值 是 什么 ， 它 很 可 能 不 是 0。 对 研究 人 员 假 设 的 支持 通常 来 源 于 证 明 总 体 
值 大 于 零 ， 并 不 需要 具体 说 明 这 一 总 体 值 具体 是 多 少 。 
































x 对 专业 统计 学 家 来 说 , 这 一 点 相当 令 人 振奋 ,是 不 是 ?统计 学 家 要 做 的 就 是 告诉 你 ， 


你 的 答案 是 错误 的 ， 无 需 提供 正确 答案 ! 


其 至 无 需 举 出 数字 实例 , 科学 哲学 家 长 久 以 来 便 声 称 , 科学 是 通过 提出 假设 并 试图 证 明 假设 
错误 而 取得 进步 的 。 对 于 真正 的 科学 来 说 ， 可 证 伪 的 假设 是 最 好 的 假设 。 

统计 分 析 通 常 按 以 下 方式 进行 : 提出 与 研究 假设 相反 的 虚无 假设 , 然后 尝试 能 否 证 伪 该 虚无 
假设 。 这 个 方法 最 早 由 20 世 纪 早 期 最 伟大 的 统计 学 家 费 欣 尔 博士 ( R. A Fisher ) 提出 ， 此 后 便 传 
播 开 来 。 此 外 还 有 一 些 其 他 的 方法 。 许 多 现代 统计 学 家 认为 我 们 应 集中 精力 对 所 关注 的 总 体 值 
( 比如 变量 间 相 关 性 的 大 小 ) 做 出 最 佳 估 计 ， 而 不 是 证 明 相 关 性 大 小 为 某 个 不 确定 的 非 零 值 。 
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i 四 1.5 ”增加 样本 量 以 减少 误差 


减少 样本 误差 的 最 佳 方式 是 增加 样本 量 。 








无 论 何 时 ， 只 要 统计 学 家 使 用 样本 而 不 是 总 体 来 做 出 推测 ， 就 必定 会 出 现 多 多 少 少 的 误差 。 
因为 推断 性 统计 的 基本 方法 就 是 测量 样本 , 并 运用 测量 结果 对 总 体 进行 估计 [Hack #], 我 们 知道 
这 种 对 总 体 值 的 估计 总 会 存在 一 些 误差 。 好 消息 就 是 我 们 也 知道 如 何 把 这 些 误差 减少 到 最 低 程 
度 。 其 解决 方案 就 是 增加 样本 量 。 

1713 年 雅 各 布 . 伯 努 利 ( Jakob Bernoulli ) 提出 了 一 个 适用 于 赌博 情境 的 早期 原则 ， 称 之 为 
“黄金 定律 ”。 这 条 定律 后 来 被 其 他 人 改称 为 “大 数 定律 ”( 始 于 1837 年 法 国 数学 家 泊 松 )。 它 可 
能 是 统计 学 历史 上 最 有 用 的 发 现 ， 为 所 有 研究 者 提供 了 关键 的 基本 通用 建议 : 增加 样本 量 ! 





























早期 的 应 用 统计 科学 (我 们 指 的 是 17 世 纪 和 18 世 纪 ) 几乎 开口 必 提 赌博 和 几率 。 这 
ww 也 许 是 因为 它 给 那 时 代 的 绅士 学 者 们 提供 了 一 个 借口 ， 打 着 智力 追求 的 惕 子 行 玩乐 
之 实 。 当 然 , 概率 定律 是 统计 程序 和 推论 的 数学 基础 ， 所 以 赌博 应 用 很 可 能 主要 是 

用 作 统 计 概 念 教学 中 的 最 佳 例 子 。 


1.5.1 本 定律 的 实际 应 用 

本 定律 的 一 个 应 用 是 它 对 预 佑 概率 和 实际 发 生 概率 的 影响 。 它 包含 这 样 一 个 推论 : 对 于 受 几率 
控制 的 结果 , 预测 准确 性 的 提高 程度 是 一 个 固定 的 值 。 也 就 是 说 , 预测 准确 性 的 提高 程度 是 已 知 的 。 
随 着 试验 的 次 数 增加 , 某 个 结果 的 预测 概率 和 你 观测 到 的 实际 发 生 概率 之 间 的 差距 缩小 , 而 且 上 述 
预期 值 和 观测 结果 之 间 的 差距 大 小 可 以 计算 出 来 。 这 种 预期 差距 一 般 称 为 标准 误差 [Hack #18]。 


结果 的 理论 概率 和 实际 发 生 概 率 之 间 的 差距 大 小 与 以 下 的 值 成 正比 : 
1 


V 笃 本 大修 
你 可 以 把 这 则 公式 看 作 大 数 定律 的 数学 表述 。 在 概率 和 结果 的 语 境 下 讨论 准确 性 , 样本 量 就 
是 试验 的 次 数 。 而 在 样本 平均 数 和 总 体 平均 数 的 语 境 下 讨论 准确 性 , 样本 量 就 是 样本 中 人 的 数量 
(或 随机 观测 的 数量 )。 
































1.5.2 ”提高 准确 性 

受 此 定律 影响 的 特定 值 的 大 小 取决 于 采用 的 测量 尺度 以 及 给 定 样 本 中 变量 的 多 少 。 然而 我 们 
可 对 样本 量 进行 种 种 改变 来 提升 推断 的 准确 性 。 表 1-5 显 示 了 所 有 推断 性 统计 的 准确 性 提升 比例 。 
依照 定律 可 知 : 
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表 1-5: 增加 样本 量 的 效应 
样本 量 误差 的 相对 降低 幅度 含 义 









































1 1 误差 等 于 总 体 中 变量 的 标准 差 

10 3.16 误差 大 小 约 为 之 前 的 1/3。 观测 的 样本 人 数 仅 仅 增加 到 10 就 极 大 提高 了 我 们 的 准 
确 性 

30 5.48 样本 人 数 从 1 增加 到 30， 会 显著 提高 准确 性 。 即 便 是 从 10 增 加 到 30 都 有 作用 

100 10 100 个 人 组 成 的 样本 产生 一 个 非常 接近 总 体 值 ( 或 者 说 期 望 概率 ) 的 估计 。 百 
人 样本 的 误差 大 小 仅 为 一 个 标准 差 的 1/10 

1000 31.62 根据 如 此 大 量 的 观测 值 产生 的 估计 是 相当 准确 的 





1.5.3 生效 原理 
让 我 们 从 几 个 不 同 的 角度 来 看 这 个 重要 的 统计 法 则 。 我 会 用 三 种 不 同 的 方法 来 阐述 这 个 定 

















律 ， 先 从 赌 徒 关 心 的 角度 开始 ， 然 后 转 到 有 关 误 差 的 话题 ,最 后 讨论 采集 代表 性 样本 的 意义 。 所 
有 这 些 实际 上 说 的 是 同一 条 规则 ， 只 不 过 阐述 方式 不 同 而 已 。 
1. 赌博 


如 果 一 件 事 在 单一 试验 中 有 特定 的 发 生 概 率 , 那么 它 在 无 限 次 试验 中 的 发 生 几 率 将 与 前 述 概 
率 相等 。 随 着 试验 次 数 接近 无 限 ， 其 发 生 概 率 将 逐渐 接近 这 个 概率 的 值 。 

2. 误差 

如 果 一 个 样本 无 限 大 , 那么 样本 统计 学 特征 就 等 于 总 体 的 参数 。 举 例 来 说 ， 随 着 样本 量 趋 近 
无 限 大 , 样本 平均 数 和 总 体 平 均 数 之 间 的 差距 逐渐 缩小 。 随 着 观测 数量 的 增加 , 总体 值 估计 的 误 
差 逐 渐变 小 ， 最 终 趋 近 于 0。 

3. 意义 

相 比 从 总 体 中 抽取 少数 人 的 样本 ,抽取 多 数 人 的 样本 更 具有 代表 性 。 随 着 样本 量 增加 ,样本 
所 体现 的 总 体 的 重要 特征 越 来 越 多 ， 同 时 预测 的 准确 性 也 随 之 提高 。 











ww 以 上 所 有 关于 大 数 定律 的 论述 成 立 的 前 提 是 : 我 们 假设 事件 的 发 生 或 取样 是 随机 的 。 


大 数 定律 为 标准 误差 的 计算 提供 了 基础 ,此 外 它 还 影响 着 其 他 一 些 核心 统计 问题 ， 比 如 检验 
力 [Hack #8] 以 及 不 该 拒绝 虚无 假设 时 却 加 以 拒绝 的 可 能 性 [Hack 殉 ]。 雅 各 布 ， 伯 努 利 的 赌 徒 伙 伴 
们 或 许 对 他 的 黄金 定律 大 感 兴趣 ， 因 为 这 能 让 他 们 心中 大 致 有 数 ， 知 道 还 需要 掷 多 少 次 货 子 ， 掷 
出 7 点 的 可 能 性 才 会 达到 0.166 或 16.6%， 然 后 据 此 制定 较 有 把 握 的 投注 计划 。 

然而 在 过 去 的 300 年 间 ， 所 有 的 社会 科学 无 不 利用 这 一 简洁 的 工具 ， 去 估计 用 可 见 的 事物 来 
描述 不 可 见 事 物 所 能 达到 的 准确 性 。 谢 谢 你 ， 雅 各 布 ! 
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1.5.4 ”参阅 
看 清 自己 错 到 何 种 程度 [Hack #18] 


J 1.6 精确 测量 
| # 6 测试 需要 综合 诸多 要 素 得 出 分 数 ， 经 由 级 测试 理论 针对 其 中 每 一 个 要 素 提 供 了 人 很 好 
的 分 析 。 该 理论 的 一 个 有 用 印 果 就 是 能 对 测试 分 数 的 精确 程度 进行 估计 和 报告 。 

一 个 良好 的 教育 或 心理 学 测试 产生 的 分 数 是 有 效 度 的 和 可 信 的 。 效 度 (validity ) 是 测试 分 数 
能 在 多 大 程度 上 体现 你 希望 测量 的 特征 ， 以 及 对 测量 意图 的 有 用 程度 。 为 了 证 明 效 度 , 你 必须 提 
供 证 据 和 理论 来 支持 测试 分 数 的 解释 是 正确 的 。 

信 度 (reliability ) 是 对 同一 个 人 多 次 重复 测量 得 到 相同 测试 分 数 的 一 致 性 程度 。 要 证 明 信 度 ， 
就 是 要 收集 重复 测量 的 数据 并 用 统计 学 方法 加 以 分 析 。 

















1.6.1 经 典 测 试 理论 

经 典 测试 理论 , 或 者 说 信和 度 理论 , 研究 测试 分 数 的 概念 。 想 想 你 某 次 参加 测验 的 观测 分 数 ( 你 
得 到 的 分 数 )。 按 经 典 测试 理论 的 定义 ， 这 个 分 数 由 两 部 分 构成 ， 用 下 列 理论 方程 式 表示 : 

观测 分 数 = 真 分 数 + 误差 分 数 

这 个 方程 式 包含 以 下 几 个 要 素 。 

@ 观测 分 数 

你 在 测验 中 取得 的 实际 分 数 。 这 通常 等 于 正确 回答 的 项 目 数 , 或 者 更 通俗 地 说 , 测试 中 获得 
的 点 数 。 

@ 真 分 数 
真 分 数 指 你 本 该 得 到 的 分 数 。 虽然 这 不 是 你 应 得 的 分 数 , 或 者 说 ， 这 不 是 最 有 效 的 分 数 。 真 
分 数 被 定义 为 你 无 数 次 参加 同一 个 测试 ， 所 得 到 的 平均 分 数 。 注意, 这 个 定义 意味 着 真 分 数 只 是 
代表 平均 表现 , 或 许 能 反映 测试 设计 测量 的 特质 , 或 许 不 能 反映 测试 设计 测量 的 特质 。 换 名 话说 ， 
一 场 测试 也 许 会 产生 真 分 数 ， 但 未 产生 有 效 的 分 数 。 

@ 误差 分 数 

指 你 的 观测 分 数 和 真 分 数 的 差距 。 

依据 本 理论 , 我 们 假定 任何 测试 的 分 数 表现 都 容易 出 现 随 机 误差 。 你 可 能 在 自己 实际 上 不 知 
道 答案 的 情况 下 ， 在 社会 学 研究 测验 中 猜 对 一 道 题 。 在 这 种 情况 下 ， 是 随机 误差 帮 了 你 。 
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刀 请 注意 ， 尽 管 这 提高 了 你 的 分 数 ， 但 依然 是 一 个 测量 “误差 ”。 








你 也 许 在 做 早饭 的 时 候 遇 到 了 一 枚 臭 鸡蛋 , 结果 心情 不 好 , 在 应 聘 笔试 时 甚至 根本 没 注 意 到 
最 后 那 组 题 。 这 里 ， 就 是 随机 误差 伤害 了 你 。 这 些 误 差 被 认为 是 随机 的 ， 因 为 它们 不 是 系统 的 ， 
它们 也 和 和 希望 测量 的 特质 无 关 。 这 些 误差 之 所 以 被 认为 是 误差 是 因为 它们 改变 了 你 的 分 数 , 使 之 
距 真 分 数 更 远 了 了。 

如 果 进 行 多 次 测量 , 这 些 随机 误差 有 时 会 提高 你 的 分 数 ， 有 时 会 降低 你 的 分 数 , 但 是 , 纵 观 整 
个 测试 ， 误 差 的 出 现 率 应 该 比较 平均 。 根 据 经 典 测试 理论 ， 信 度 [Hack #41] 是 测试 分 数 随机 波动 的 
程度 。 代 表 信 度 的 数字 通常 是 通过 观察 测试 中 项 目 间 的 相关 性 来 计算 。 这 个 指数 范围 分 布 在 0.0 和 
1.0 之 间 ，1.0 表 示 一 组 没有 任何 随机 误差 的 分 数 。 指 数 越 接近 1.0， 分 数 随机 波动 的 程度 越 小 。 




















1.6.2 ”标准 误差 的 测量 


尽管 随机 误差 应 该 在 多 次 测试 情境 下 彼此 消长 达到 平衡 , 但 不 完美 信 度 依旧 受到 关注 , 因为 
决策 几乎 总 是 基于 单 次 测试 所 得 到 的 分 数 。 比 如 在 SAT 考 试 中 ， 如 果 你 旁 座 的 考生 洒 了 古龙 香水 
使 你 注意 力 不 集 中 ,结果 考 砸 了 ,这 种 情况 下 ,知道 从 长 远 来 看 自己 的 考试 成 绩 会 反映 你 的 真 分 

测量 学 专家 已 经 发 明 出 了 一 套 公 式 , 用 来 计算 你 的 真实 分 数 水 平 落 入 的 区 间 范 围 。 这 个 公式 
利用 了 一 个 叫做 “测量 标准 误差 ”的 值 。 在 一 个 测试 分 数 总 体 中 , 测量 的 标准 误差 是 每 个 人 的 观 
测 分 数 与 其 真 分 数 之 间 的 平均 距离 。 测量 标准 误差 是 利用 测试 的 信 度 信息 和 群 组 观测 分 数 的 变异 
量 〈 用 标准 差 来 反映 ) 信息 来 估计 的 [Hack #2]。 

计算 测量 标准 误差 的 公式 是 : 





























标准 误差 = 标准 差 V1- 信 度 


以 下 的 例子 说 明了 如 何 应 用 这 一 公式 。 许 多 研究 生 院 根据 GRE 测 验 的 分 数 制定 录取 决策 。 
GRE 中 的 文字 推理 ( Verbal Reasoning ) 的 分 数 范围 是 200 分 到 800 分 ， 平 均值 为 500 分 ( 实际 上 ， 
近年 来 的 平均 分 比 这 个 要 低 一 点 )， 标 准 差 是 100。 

GRE 测 斌 分数 的 佑 测 信和 度 通 常 在 0.92 左 右 ， 这 个 值 是 相当 高 的 。 如 果 你 参加 GRE 测 验 ， 得 到 
了 520 分 ,那么 恭喜 你 啦 ， 高 于 平均 分 。520 分 是 你 的 观测 分 数 ,但 你 的 成 绩 容易 受到 随机 误差 影 
响 。520 分 有 多 接近 你 的 真 分 数 呢 ? 使 用 标准 误差 测量 公式 ， 可 以 计算 如 下 : 

(1) 1-0.92=0.08 

(2) 0.08 的 平方 根 是 0.28 
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(3) 100 x 0.28=28 


GRE 测 验 的 标准 误差 约 为 28 分 ， 所 以 你 的 本 次 成 绩 $20 分 很 可 能 处 于 多 次 测验 所 得 平均 分 上 
下 28 分 的 区 间 内 。 


1.6.3 ”建立 置信 区 间 

观测 分 数 很 可 能 在 真 分 数 的 一 个 测量 标准 误差 范围 内 ， 这 是 什么 意思 ? 如 果 有 68% 的 几率 ， 
观测 分 数 在 真 分 数 的 一 个 测量 标准 差 内 , 那么 这 是 测量 统计 学 家 所 接受 的 。 然 而 应 用 统计 学 家 喜 
欢 超 过 68%， 他 们 更 愿 描 述 为 有 95% 的 可 能 性 包含 真 分 数 的 观测 分 数 区 间 。 

想 要 说 有 95% 的 把 握 分 数 区 间 包 含 了 个 体 的 真 分 数 , 那么 报告 的 分 数 区 间 应 该 是 由 加 减 大 约 
两 个 测量 标准 误差 构成 。 图 表 1-1 显 示 了 GRE 的 520 的 置信 区 间 。 



































68% 置 信 区 间 
A6 4 576 
95% 置信 区 间 









































450| 460| 470| 480| 490| 500| 510| 520| 530| 540| 550| 560| 570| 580 
常见 的 GRE 分 数 




















图 1-1: GRE 得 分 为 520 分 的 置信 区 间 
1.6.4 生效 原理 
使 用 测量 标准 误差 构建 置信 区 间 的 方法 是 基于 如 下 假设 : 误差 〈 或 误差 分 数 ) 是 随机 的 且 
这 些 随 机 误差 呈正 态 分 布 。 这 里 展示 的 正 态 曲线 [Hack 疙 5] 就 跟 全 世界 凡 有 人 类 的 地 方 所 展示 的 
一 样 。 它 的 形状 被 大 家 所 熟知 并 已 被 精确 定义 好 了 。 有 了 精确 性 ， 就 能 够 计算 精确 的 置信 区 间 。 
测量 标准 误差 是 一 个 标准 差 。 在 这 种 情况 下 ,， 它 是 误差 分 数 距 真 分 数 的 标准 差 。 在 正 态 曲 线 
下 ，68% 的 值 都 在 平均 数 的 一 个 标准 差 之 内 ，95% 的 分 数 都 大 约 在 两 个 标准 差 内 ( 更 准确 地 说 ， 
是 1.96 个 标准 差 )。 就 是 这 套 广为人知 的 概率 使 得 测量 人 员 能 够 讨论 95% 或 者 68% 的 置信 和 度 。 
































1.6.5 意义 讨论 

知道 测试 分 数 95% 的 置信 区 间 有 什么 用 呢 ? 如 果 是 你 要 求学 生 参考 并 根据 测试 分 数 来 做 决 
策 ， 那 么 你 就 能 判断 参考 者 的 能 力 是 否 在 你 所 设 定 的 成 功 标 准 范围 内 。 

如 果 你 是 参考 者 , 那么 你 就 能 蛮 有 把 握 地 知道 自己 的 真 分 数 在 某 个 区 间 内 。 这 可 能 会 激励 你 
再 次 参加 考试 , 对 自己 赁 运气 可 能 取得 的 更 好 表现 有 一 个 合理 的 预期 。 如 果 你 这 次 的 GRE 分 数 是 
520 分 ， 那 么 你 就 有 95% 的 把 握 说 ， 假 如 你 马上 再 考 一 回 ， 新 分 数 可 能 会 高 达 576 分 ， 当 然 ， 也 有 
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可 能 低 到 464 分 。 


ZE 1.7 提高 测量 尺度 
l 六 居 ”四 种 测量 尺度 决定 了 利用 测量 了 扩 得 分 数 的 方式 。 如 果 你 没有 正确 地 应 用 测量 尺度 ， 屠 
么 就 不 能 随心 了 所 窝 玩 转 这 些 分 数 。 
统计 学 方法 分 析 数 字 。 当 然 ， 这 些 数 字 必 须 有 意义 ,不然 的 话 ， 分 析 就 没有 多 大 价值 。 统计 
学 者 把 有 意义 的 数字 称 为 分 数 。 但 是 ， 统 计 学 中 使 用 的 分 数 并 不 都 “ 生 而 平等 ”"。 不 同 的 分 数 因 
其 生成 时 遵循 的 规律 不 同 而 载 有 不 同 的 信息 量 。 
当 你 决定 测量 某 个 对 象 时 , 必须 音 慎 选择 赋值 的 规则 。 测量 尺度 决定 了 哪 种 统计 分 析 是 合适 
的 ， 哪 种 是 有 效 的 ， 哪 种 是 有 意义 的 。 











测量 是 对 事物 进行 有 意义 的 赋值 。 被 测量 的 事物 可 以 是 具体 的 对 象 ， 比 如 岩石 ， 也 
可 以 是 抽象 的 概念 ， 比 如 每 力 。 


我 们 举 个 例子 来 解释 “分 数 并 不 都 生 而 平等 ”这 句 话 的 含义 。 假 设 你 有 5 个 孩子 ， 都 参加 了 
一 场 拼 写 测试 。 满 分 是 100 分 ， 查 克 得 了 90 分 ， 迪 克 和 简 都 得 了 80 分 ， 鲍 勃 得 了 75 分 ， 顿 只 得 了 
50 分 。 如 果 有 个 朋友 问 你 ， 和 孩子 们 在 这 场 重 要 测验 中 表现 如 何 ， 你 可 能 会 说 他 们 平均 分 是 75 分 。 
这 是 一 个 合理 的 概况 总 结 。 现 在 ， 想 象 一 下 你 的 $ 个 孩子 参加 竞走 对 抗 赛 ， 这 次 是 鲍 勃 第 一 ， 简 
第 二 , 迪克 第 三 ， 查 克 第 四 ， 顿 第 五 。 你 那 爱 管 闲事 的 朋友 又 问 孩 子 们 表现 如 何 。 你 带 着 自 察 的 
筑 容 说 ,他们 平均 拿 到 了 第 三 名 。 这 次 就 不 再 是 合理 的 概括 总 结 ， 因 为 它 没 提供 任何 信息 。 以 上 
两 种 情况 都 使 用 了 分 数 来 表示 成 绩 ， 其 中 的 区 别 只 在 于 选用 的 测量 尺度 不 同 。 

一 共有 四 种 测量 尺度 ， 即 四 种 以 数字 表示 分 数 的 方法 ,它们 分 别 是 名 义 测量 、 次 序 测量 、 等 
距 测 量 和 等 比 测量 。 不 同 尺度 的 区 别 在 于 所 含 信 息 量 , 以 及 在 何 种 程度 上 可 对 其 进行 有 意义 的 数 
学 和 统计 分 析 。 














1.7.1 将 数字 当做 标签 

如 果 你 只 打算 用 分 数 表 示 事 物 所 属 的 不 同类 别 , 那 就 选择 名 义 测 量 。 名 义 测量 仅 把 数字 用 做 
名 称 ， 即 表示 不 同类 别 的 标签 。 

比如 ,一 名 科学 家 收集 了 男女 受 试 者 的 数据 , 他 用 数字 1 来 表示 男性 测试 对 象 , 用 数字 2 表示 
女性 测试 对 象 ， 这 就 是 在 名 义 尺 度 上 使 用 数字 。 请 注意 ， 尽 管 数字 2 在 数学 上 比 数字 1 大 , 但 在 这 
个 数据 集 里 ，2 不 代表 更 多 ， 它 只 作为 一 个 名 称 使 用 。 
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1.7.2 用 数字 来 表示 次 序 


如 果 你 想 用 顺序 或 次 序 来 分 析 你 掌握 的 分 数 , 那 就 选择 次 序 尺度 进行 测量 。 次 序 测量 提供 了 名 
义 测量 提供 的 所 有 信息 , 但 增加 了 分 数 的 次 序 信息 。 具有 更 大 数值 的 数字 能 够 和 更 小 数值 的 数字 比 
较 ， 任 何 被 测量 的 对 象 都 能 排出 一 个 有 意义 的 序列 ， 不 管 是 人 或 者 海 铬 还 是 别 的 什么 事物 。 

就 拿 你 高 中 时 的 全 班 成 绩 排名 作为 例子 : 毕业 典礼 上 致辞 的 最 优生 通常 是 平均 成 绩 排 第 一 的 
那个 人 。 请 注意 ,你 可 以 和 其 他 人 比较 名 次 ,但 是 你 不 知道 名 次 之 间 的 具体 分 数 差距 是 多 少 。 在 
竞走 比赛 中 ， 第 一 名 可 能 只 领先 第 二 名 1 秒 ， 而 第 二 名 可 能 比 第 三 名 领先 30 秒 。 
































1.7.3 ”用 数字 来 显示 距离 


等 距 测 量 涵盖 了 之 前 两 个 测量 尺度 的 全 部 信息 , 并 新 增 了 准确 性 这 一 元 素 。 这 种 测量 尺度 产 
生 的 分 数 ， 被 认为 在 任何 两 个 毗邻 的 分 数 间 有 相等 的 差距 。 

例如 ,在 温度 计 上 ,70 度 和 69 度 间 的 1 度 差距 是 有 意义 的 , 它 完全 等 同 于 32 度 和 31 度 之 间 的 1 
度 差 距 。 这 样 的 1 度 差 距 无 论 出 现在 温度 计 上 的 哪个 位 置 ， 都 代表 着 相同 的 热量 值 (你 也 可 以 说 ， 
温度 计 中 液体 所 受 的 压力 )。 

等 距 尺度 提供 了 比 次 序 尺度 更 多 的 信息 , 现在 你 能 对 分 数 进行 有 意义 的 均 隔 了 。 大 多 数 教育 
和 心理 测量 都 发 生 在 等 距 测量 这 个 尺度 上 。 

虽然 就 我 们 在 统计 学 上 能 做 什么 和 不 能 做 什么 而 言 , 等 距 测 量 看 起 来 能 解决 所 有 的 问题 , 但 
依然 有 一 些 数 学 运算 在 这 个 尺度 上 没有 意义 。 比 如 , 我 们 不 用 小 数 或 比例 进行 比较 。 想 想 我 们 讨 
论 温度 的 方式 。 如 果 昨 天 的 气温 是 华氏 80 度 , 今天 降 到 华氏 40 度 ,我 们 并 不 说 “今天 是 昨天 的 一 
半 热 ”"。 我 们 同样 不 说 ， 一 个 IQ 为 120 的 学 生 比 IQ 为 90 的 学 生 聪 明 1/3。 

















”等 距 (interval ) 一 词 源 自古 代 城 堡 建筑 。 你 知道 那些 弓箭 手 防御 驻守 的 角楼 或 塔楼 

代 吗 ? 那些 塔楼 尖顶 周 围 的 圆 形 护 墙 ， 通 常 在 每 两 块 墙 坷 之 间 留 一 个 射箭 的 坷 口 。 这 
些 到 口 叫做 等 距 ( 意 为 “两 吉 之 间 ”)， 最 好 的 防御 设计 就 是 等 距 设 置 墙 吉 和 翅 口 ， 
以 提供 360 度 的 保护 。 


1.7.4 用 数字 来 计数 


等 比 测量 作为 测量 的 最 高 尺度 , 不 但 提供 低 尺 度 测 量 涵盖 的 所 有 信息 , 还 能 够 进行 比例 比较 
和 生成 百分比 。 等 比 测量 实际 上 是 我 们 观察 和 考量 自然 世界 最 常用 和 最 直观 的 方法 。 我 们 数 数 的 
时 候 ， 使 用 的 就 是 等 比 测量 尺度 。 邻 居 门 厅 里 有 几 只 狗 ” 这 个 问题 的 答案 也 采用 了 等 比 尺 度 。 
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等 比 测量 提供 了 如 此 之 多 的 信息 , 而 且 能 够 进行 所 有 可 能 的 统计 运算 ,因为 比例 尺度 拥有 绝 
对 意义 的 零点 。 这 个 绝对 意义 的 零点 意味 着 在 刻度 尺 上 一 个 人 可 以 得 0 分 ， 在 被 测量 的 特征 上 真 
正 得 0 分 。 虽然 温度 计 上 也 有 一 个 0, 但 气温 为 0 度 不 意味 着 绝对 没有 热量 。 在 等 距 刻 度 上 ， 比 如 
我 们 的 温度 计 上 ,分 数 可 以 是 负 值 。 但 在 等 比 测量 尺度 中 却 没 有 人 负 值 。 











1.7.5 ”选择 合适 的 测量 尺度 

哪个 测量 尺度 适合 你 ”因为 达到 等 距 尺 度 所 得 到 的 优势 , 所 以 大 多 数 社会 科学 家 倾向 于 在 等 
距 和 等 比 尺度 上 进行 测量 。 在 等 距 尺 度 ， 你 能 够 安全 地 进行 描述 性 统计 ， 执行 推断 统计 分 析 ， 比 
如 {检验 、 方 差分 析 以 及 相关 性 分 析 。 表 1-6 概 括 表 现 了 每 个 测量 尺度 的 优点 和 缺点 。 





表 1-6: 测量 尺度 
































测量 尺度 优 点 缺点 
名 义 测量 描述 分 类 数据 数据 不 代表 数量 
次 序 测量 允许 分 数 间 比 较 很 难 概括 分 数 
等 距 测量 可 进行 大 多 数 统计 分 析 不 能 进行 比例 比较 
等 比 测量 绝对 零点 使 得 所 有 的 统计 分 析 都 能 完成 有 些 变量 没有 绝对 零点 
为 了 对 他 人 的 研究 数据 选取 正确 的 统计 分 析 方法 , 需要 先 识别 他 所 使 用 的 测量 太 度 并 利用 该 














测量 尺度 的 优势 。 如 果 是 你 自己 生成 数据 ， 可 以 考虑 提高 测量 尺度 : 采用 尽 可 能 高 的 测量 尺度 。 


1.7.6 ”具有 争议 的 工具 


自从 20 世 纪 50 年 代 测 量 尺度 概念 被 广泛 接受 以 来 , 一 直 存 在 一 些 争 议 , 即 我 们 是 否 真 的 有 必 
要 等 距 尺 度 上 执行 统计 分 析 。 有 很 多 常用 的 测量 形式 ( 比如 态度 量 表 、 知 识 测 验 或 人 格 测验 ) 不 
是 确定 无 疑 地 在 等 距 尺 度 上 进行 的 , 它们 也 许 处 于 次 序 测量 的 最 顶端 。 我 们 能 在 分 析 中 安全 地 使 
用 这 些 本 该 在 等 距 尺 度 上 获得 的 数据 吗 ? 

研究 文献 中 的 一 个 主要 共识 是 : 如 果 你 至 少 处 于 次 序 尺 度 , 而 且 有 把 握 能 对 等 距 尺 度 统计 分 
析 做 出 解释 , 那么 你 就 可 以 在 这 种 类 型 的 数据 上 安全 地 执行 推 呆 性 统计 分 析 。 顺 带 说 一 句 , 在 现 
实 研究 中 ， 几 乎 每 个 人 都 在 有 意识 或 无 意识 地 采用 这 个 方法 。 

但 是 , 我 们 很 难 和 否认 依据 测量 尺度 进行 统计 分 析 决 策 这 一 基本 理念 。 一 个 足以 说 明 测 量 尺度 
重要 性 的 经 典 例子 是 费 雷 德里 克 ' 洛 德 ( Frederick Lord ) 在 1953 年 发 表 的 论文 “橄榄 球 运动 数字 
处 理 的 统计 ”( “On the Statistical Treatment of Football Numbers”,《 美 国 心理 学 家 》 杂 志 ，Vol. 8， 
750~751 )。 这 位 粗心 的 统计 学 家 热切 地 分 析 了 一 些 所 关注 球 队 的 数据 , 写 出 了 一 篇 满 是 平均 数 和 
标准 差 以 及 其 他 一 些 复杂 分 析 的 报告 。 但 后 来 发 现 , 这 些 数 据 竟然 是 运动 员 所 穿 运动 衫 上 的 数字 。 
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也 许 ， 这 是 一 个 没有 注意 到 测量 尺度 的 明显 例子 。 但 这 个 统计 学 家 仍然 力 挺 自己 的 报告 。“ 这 些 
数据 本 身 不 知道 自己 从 哪儿 来 ,” 他 辩解 说 ,“ 但 它们 依然 有 效 。 








1 1.8 提高 检验 力 
ns 刻 功 通常 被 定义 为 发 现 了 统计 显著 性 。 为 提高 做 出 住 何 发 现 约 几 
有 统计 见识 的 超 一 流 科 学 家 应 当 主要 致力 于 提 高 检验 力 oO 


进行 基于 统计 的 研究 ,会 遇 到 两 种 潜在 的 陷阱 。 科 学 家 们 可 能 认定 自己 在 总 体 中 发 现 了 什么 ， 
ee 1 存在 于 他 们 手头 的 样本 中 。 反 之 , 他 们 也 可 能 在 样本 中 什么 都 没 找到 , 但 实际 

， 总 体 中 确实 存在 极 妙 的 相关 性 ， 只 待 他 们 去 发 现 。 

第 一 个 问题 可 通过 代表 取样 而 最 小 化 [Hack #19]。 第 二 个 问题 可 通过 提升 统计 检验 力 来 
解决 。 








1.8.1 检验 力 


在 社会 科学 研究 中 , 统计 分 析 总 要 判断 样本 中 观测 到 的 某 个 值 有 没有 可 能 是 随机 发 生 的 。 这 
个 过 程 称 作 显 著 性 检测 。 显 著 性 检测 产生 一 个 p 值 ( 概率 值 ), 表示 样本 可 以 从 特定 的 相关 总 体 中 
抽取 的 概率 。 

P 值 越 低 ， 我 们 就 越 有 信心 认定 ， 相 关 结 果 具 有 统计 显 车 性， 而且 数 据 揭示 出 的 相关 性 不 仅 
存在 于 样本 中 ,也 存在 于 其 代表 的 总 体 中 。 通常 来 讲 , 会 对 测量 的 事物 选择 一 个 预先 设 定好 的 显 
著 性 水 平 作为 标准 。 如 果 最 后 p 值 等 于 或 小 于 预先 设 定 的 显著 性 水 平 ， 就 表明 研究 达到 了 一 定 的 
显著 性 水 平 。 























统计 分 析 和 显著 性 检验 并 不 局 限于 确认 变量 间 的 关系 ， 借 助 一 些 最 常见 的 分 析 (t 
肛 检验 、F 检 验 、 卡 方 检验 、 相 关系 数 、 回 归 方 程 等 ) 通常 能 i ee 目的 。 我 在 此 
讨论 相关 性 ， 是 因为 这 是 你 所 期 望 的 典型 效应 。 


统计 检验 的 效力 是 指 : 假定 总 体内 的 变量 间 存 在 相关 性 , 统计 分 析 达 到 显著 性 的 概率 。 注 意 
这 是 一 个 条 件 概率 。 总 体 中 必须 存在 相关 性 ， 否 则 ， 检 验 力 就 毫 无 意义 。 
检验 力 不 是 找到 显著 性 结果 的 几率 , 它 是 在 相关 性 存在 的 前 提 下 ， 找到 相关 性 的 几率 。 检验 
力 公式 包含 三 个 组 成 部 分 : 
口 样本 量 ; 
口 预 设 要 达到 的 ( 需 小 于 ) 显著 性 水 平 (z 值 ); 
口 效应 值 (总体 中 相关 性 的 大 小 )。 
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1.8.2 ”执行 检验 力 分 析 
假设 我 们 要 对 比 两 组 不 同 的 样本 , 看 它们 之 间 是 否 存 在 足够 的 差异 , 能够 说 明 二 者 各 自 代 表 
的 总 体 间 确 实 存在 差异 。 比 如 ， 假 设 你 想 要 知道 男性 和 女性 谁 的 睡眠 时 间 长 。 


这 个 设计 非常 简单 。 创 造 两 组 样本 群 : 一 组 男性 ,一 组 女性 。 然 后 ， 调 查 两 组 人 ， 问 他 们 每 
晚 通常 睡 几 个 小 时 。 但 是 , 为 了 找 出 真正 的 差异 , 你 需要 调查 多 少 人 ? 这 就 是 一 个 检验 力 的 问题 。 
































情况 下 ,统计 显著 性 意味 着 这 两 组 样本 所 代表 的 两 个 总 体 间 的 分 数 差 异 很 可 能 
天 于 零 。 


在 研究 开始 前 , 研究 人 员 可 以 决定 统计 分 析 中 使 用 的 检验 力 。 为 了 计算 检验 力 , 需要 知道 三 
样 东西 ， 但 其 中 两 样 在 研究 开始 前 就 已 经 知道 了 : 你 能 决定 样本 量 以 及 选择 预 设 的 显著 性 水 平 。 
你 所 不 知道 的 是 变量 间 相 关 性 的 实际 大 小 ， 因 为 计划 中 的 研究 结果 数据 还 没有 产生 。 

研究 人 员 能 在 人 研究 开始 前 对 所 关注 变量 之 间 的 相关 性 大 小 ( 即 效应 值 ) 进行 估计 , 检验 力 同 
样 可 以 在 研究 开始 前 被 估计 。 通 常 来 讲 ， 研 究 人 员 会 对 最 重要 或 最 感 兴 趣 的 方面 设 定 最 小 相关 
水 平 。 

一 旦 这 三 样 ( 样本 量 、 显 著 性 水 平和 效应 力 ) 都 确定 了 ， 便 可 计算 第 四 样 (效应 力 ) 了 。 实 
际 上 ,在 这 四 样 东西 中 , 设 定 了 任何 三 样 的 水 平 ， 都 能 计算 出 第 四 样 。 比 如 ,一 名 研究 人 员 通 常 
知道 分 析 中 需要 的 检验 力 大 小 、 报 告 具 有 统计 显著 性 所 需 的 效应 值 、 选 择 的 预 设 显著 性 水 平 。 有 
了 这 些 信 息 ， 研 究 人 员 就 可 以 计算 出 需要 的 样本 量 。 
























































x 为 了 估计 检验 力 ， 研究 人 员 经 常 使 用 一 个 得 到 普遍 接受 的 标准 方法 ,其 中 将 检验 力 
目标 值 设 为 0.80, 将 预 设 显 著 水 平 设 为 0.05。 检验 力 水 平 在 0.80，, 意味 着 总 体 中 如 果 
存在 相关 ， 那 么 研究 人 员 会 有 80% 的 几率 在 样本 中 发 现 相关 性 或 效应 。 


t 检 验 中 ,效应 值 (或 者 相关 性 大 小 指数 [Hack #10] ) 常用 两 组 平均 数 差 除 以 样本 标准 差 所 得 
的 值 来 表达 。 如 此 得 出 的 效应 值 ，0.2 以 内 视 为 小 ，0.2~0.5 视 为 中 ，0.8 视 为 大 。 效 应 力 分 析 需 
要 解决 的 问题 是 : 这 两 组 中 各 需要 多 大 样本 (多少 人 ) 才能 在 测试 分 数 中 找到 显著 性 差异 ? 

计算 检验 力 的 推导 方法 很 复杂 ,在 此 就 不 予 介 绍 了 。 在 现实 生活 中 , 我 们 估计 检验 力 一 般 是 
运用 计算 机 软件 , 或 者 查考 统计 书后 所 附 的 密密麻麻 的 表格 。 不 过 , 我 算出 了 各 种 选项 的 效应 值 ， 
呈现 在 了 在 表 1-7 里 。 注 意 关键 变量 是 效应 值 和 样本 量 。 依 据 传统 习惯 ,我 把 检验 力 设置 为 0.80， 
显著 水 平 设 为 0.05。 
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表 1-7: 不 同 效应 值 所 需 样本 量 





效应 值 样本 量 
0.10 1600 
0.20 400 
0.30 175 
0.40. 100 
0.50 65 

1.0 20 








想象 一 下 ， 在 你 的 “性 别 与 睡眠 ”研究 中 存在 实际 差异 ,但 很 小 。t 检 验 分 析 中 将 大 约 0.2 标 
准 差 的 组 间 差 异 视 为 小 差异 ， 所 以 你 可 能 会 预期 效应 值 为 0.2。 为 了 发 现 这 个 小 的 效应 值 ， 每 组 
的 样本 量 需 要 达到 400 人 ! 随 着 效应 值 的 增加 ， 所 需 样本 量变 小 。 如 果 总 体 效应 值 是 1.0 (一 个 非 
常 大 的 效应 值 ， 两 组 间 存 在 巨大 差异 )， 每 组 20 人 就 足够 了 。 











1.8.3 ”推测 极 妙 的 相关 性 


科学 家 总 是 依赖 统计 推论 来 拒绝 或 接受 他 们 的 研究 假设 。 他 们 总 使 用 虚无 假设 , 先 设 定 变 量 
间 不 具 相 关 性 或 组 间 没 有 差异 性 。 如 果 样 本 显示 总 体 中 的 变量 间 实 际 上 存在 相关 性 , 他 们 就 会 拒 
绝 虚 无 假设 [Hack #4]， 接 受 备 择 假 设 ， 即 他 们 的 研究 假设 ， 作 为 对 现实 的 最 好 估计 。 

当然 ， 这 个 过 程 中 可 能 出 现 错误 。 表 1-8 列 出 了 在 假设 检验 游戏 中 可 能 出 现 的 错误 类 型 。 当 
你 不 应 该 拒绝 虚无 假设 时 你 却 拒 绝 了 ， 统计 哲学 家 们 将 这 种 错误 称 为 I 型 错误 。 当 你 应 该 拒绝 虚 
无 假设 的 时 候 ， 却 没有 拒绝 ， 这 被 称 为 [型 错误 。 





























表 1-8: 假设 检验 中 的 错误 








行 ” 为 虚无 假设 是 对 的 虚无 假设 是 错 的 
拒绝 虚无 假设 I 型 错误 显著 性 发 现 
接受 虚无 假设 正确 的 决策 I 型 错误 





作为 一 名 聪明 的 科学 家 , 你 要 做 的 是 避免 这 两 类 错误 , 并 发 现 显 著 性 。 当 虚无 假设 是 正确 的 ， 
接受 虚无 假设 ， 获 得 正确 的 决策 也 不 错 ， 但 这 没有 发 现 显著 性 那么 有 趣 。“ 把 你 的 一 生 贡 献 给 表 
格 中 的 右上 象限 吧 ,” 我 叔 权 弗兰克 经 常 说 ,“ 你 将 变 得 超 乎 想象 地 开心 和 富有 !” 

要 想 加 大 发 现 统计 显著 性 的 几率 , 一 个 在 你 控制 之 外 的 条 件 必须 为 真 ; 那 就 是 ， 虚无 假设 必 
须 为 假 ， 否 则 “发 现 ” 什 么 的 几率 就 少 得 可 怜 。 此 外 ， 如 果 你 “发 现 ” 了 什么 , 但 它 实 际 上 并 不 
存在 ,你 就 犯 下 了 严重 的 I 型 错误 。 在 总 体 的 研究 变量 间 必 须 确实 存在 相关 性 ， 这 是 你 在 样本 中 
发 现 这 种 相关 性 的 前 提 。 
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所 以 ， 你 最 终 是 否 落 在 表 1-8 右 列 中 ， 完 全 取决 于 命运 。 检 验 力 是 一 日 你 到 达 右 列 就 移 到 顶 ff 
格 的 几率 。 换 句 话说 ， 检 验 力 是 当 虚 无 假设 为 雇 时 ， 正 确 拒 绝 虚 无 假设 的 几率 。 


1.8.4 生效 原理 


效应 值 和 样本 量 之 间 的 关系 是 有 意义 的 。 想 象 有 一 种 动物 典 在 干草 堆 里 ( 这 动物 是 效应 值 ， 
拜托 ,只 在 我 的 这 个 比喻 中 有 效 ) 你 只 需 较 少 的 观察 ( 撩 开 几 把 干草 ) 便 可 发 现 大 的 效应 值 ( 比 
如 一 头 大 象 )， 这 要 比 发 现 一 种 小 动物 ( 比如 像 可 爱 的 水 猎 幼 患 ) 方便 得 多 。 人 数 代 表 观 察 数 ， 
隐藏 在 总 体 中 的 大 效应 值 比 小 效应 值 更 容易 发 现 。 

检验 力 中 效应 值 和 样本 量 的 普遍 关系 , 反 过 来 也 同样 有 效 。 在 已 知 的 效应 值 下 估计 ， 只 消 提 
高 样本 量 , 到 一 定 程度 就 会 拥有 你 所 需 的 检验 力 。 记 住 , 表 1-7 假 定 你 想 要 80% 的 检验 力 。 你 可 以 
采取 较 小 的 样本 量 ， 只 是 会 有 较 低 的 检验 力 。 








1.8.5 不 适用 领域 


记 住 检验 力 不 等 于 成 功 的 几率 ,这 很 重要 。 它 其 至 不 是 达到 某 个 显著 水 平 的 几率 。 它 是 在 人 研 
究 者 的 所 有 估计 值 都 是 正确 的 情况 下 , 达到 某 个 显著 水 平 的 几率 。 这 公式 最 难 估计 或 设置 的 部 分 
是 总 体 中 的 效应 值 。 研 究 者 很 少 知道 自己 在 找寻 的 事物 相关 性 有 多 大 。 归 根 到 底 ， 如果 他 知道 研 
究 变 量 间 相关 性 的 大 小 ， 那 就 没有 做 研究 的 必要 了 ， 是 吧 ? 























1 0 1.9 展示 因果 
下 居 席 计 研究 人 员 已 经 什 立 了 一 些 基本 原则 ,如 果 你 大 望 证 明 一 件 事情 是 另 一 件 事 靖 的 原 
因 ， 那 你 就 得 道 守 这 些 原 则 o 


使 用 统计 数据 的 社会 科学 研究 有 着 广泛 的 目标 。 其 中 一 个 目标 是 收集 和 分 析 有 关 世 界 的 数 
据 ， 用 来 支持 或 和 否定 变量 间 关 系 的 假设 。 第 二 个 目标 是 检验 假设 ， 看 变量 间 是 否 存在 因果 相关 。 
与 目标 二 相 比 ， 目 标 一 是 件 容 易 的 事 。 

世间 万 物 之 间 存 在 各 种 各 样 的 关系 , 统计 学 家 也 发 明了 各 种 方法 来 找到 这 些 关 系 , 但 是 相关 
性 的 存在 并 不 意味 着 某 个 特定 变量 是 男 外 一 个 变量 的 原因 。 比 如 ,人 群 中 身高 和 体重 之 间 存 在 良 
好 的 正 相关 [Hack #11]， 但 是 如 果 我 瘦 几 磅 ， 我 不 会 变 矮 。 反 过 来 说 ， 如 果 我 长 高 了 儿 英 寸 , 我 
的 体重 很 可 能 会 增加 。 

只 知道 两 者 相关 ,并 不 能 真正 告诉 我 一 件 事 是 否 导致 另 一 件 事 的 发 生 。 不 过 ,相关 性 缺失 似 
乎 能 说明 因果 方面 的 问题 。 如 果 两 个 变量 间 不 存在 相关 性 ,似乎 就 能 排除 一 个 变量 是 另外 一 个 变 
量 原因 的 可 能 性 。 相 关 性 存在 使 得 因果 关系 有 可 能 存在 ， 但 无 法 证 明 它 的 存在 。 
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1.9.1 设计 有 效 的 实验 

研究 人 员 已 经 发 展 出 一 种 框架 , 用 来 讨论 各 种 研究 设计 , 以 及 这 些 设计 是 否 有 可 能 证 明 一 个 
变量 对 另 一 变量 产生 影响 。 不 同 的 设计 在 于 有 无 对 照 组 以 及 被 试 如 何 分 配 。 

基于 设计 能 和 否 提 供 因果 关系 的 强 证 据 、 中 等 证 据 、 弱 证 据 或 是 无 证 据 ， 共 有 四 种 基本 的 组 设 
计 类 别 。 

。 非 实验 设计 

这 类 设计 通常 只 包含 一 组 人 , 统计 数据 常 被 用 来 描述 总 体 或 是 证 明 谈 量 间 关系 。 这 种 设计 的 
一 个 例子 是 相关 性 研究 ， 分 析 变 量 间 简 单 的 关联 [Hack #11]。 这 种 类 型 的 设计 并 不 提供 因果 关系 
证 明 。 

@ 预 实验 设计 

这 类 设计 通常 对 一 组 人 运用 两 套 或 更 多 的 测量 手段 , 看 结果 是 否 有 所 改变 。 这 个 设计 的 一 个 
例子 就 是 对 一 组 人 进行 预测 试 ， 对 他 们 做 点 什么 , 然后 对 他 们 做 一 次 实验 后 测试 , 看 他 们 的 分 数 
是 否 发 生 了 改变 。 这 种 类 型 的 设计 提供 了 很 弱 的 因果 关系 证 明 ， 因为 除了 你 对 这 些 人 施加 的 作用 
外 ,还 有 其 他 的 外 力 可 能 会 导致 分 数 的 改变 。 

。 类 实验 设计 

这 种 设计 包含 不 止 一 组 人 ,至 少 会 有 一 组 作为 对 照 组 。 对 各 组 成 员 的 分 配 不 是 随机 的 ， 而 是 
通过 研究 者 无 法 控制 的 一 些 东西 决定 的 。 这 种 设计 的 一 个 例子 就 是 对 比 男性 和 女性 对 统计 学 的 态 
度 差 异 。 最 好 的 情况 下 ， 这 种 设计 能 提供 因果 关系 中 等 强度 的 证 明 。 如 果 没 有 随机 分 组 ， 各 和 群 组 
很 可 能 在 一 批 未 测量 的 变量 上 不 等 同 ， 这 种 不 等 同 可 能 是 导致 所 发 现 差异 的 真正 原因 。 

。 实验 设计 

这 类 设计 有 一 个 对 照 组 , 重要 的 是 , 被 试 是 随机 分 配 到 各 组 的 。 随 机 分 配 被 试 使 得 研究 人 员 
可 以 假定 所 有 的 群 组 在 未 测量 变量 上 是 等 同 的 ， 因 此 (在 理论 上 )， 如 果 发 现任 何 差异 性 ， 则 把 
它们 剔除 作为 备 择 解释 。 这 种 设计 的 一 个 例子 就 是 药物 研究 ， 所 有 被 试 被 随机 分 配 到 两 组 ,一 组 
服用 药物 ， 另 一 组 作为 对 照 组 ， 服 用 安奈 剂 ( 糖 妃 )。 











































































































1.9.2 ”体重 会 影响 身高 吗 


在 本 条 Hack 的 稍 前 部 分 , 我 提 到 关于 相关 性 的 一 个 著名 发 现 : 在 人 群 中 , 身高 和 体重 似乎 存 
在 相关 。 比 如 ,个 子 高 的 男性 胖 些 ， 个 子 矮 的 男性 瘦 些 。 我 觉得 这 个 说 法 挺 滑稽 的 ， 因 为 如 果真 
是 这 样 , 那么 只 要 给 他 们 多 吃 点 , 他 们 就 会 长 高 一 些 。 因 为 我 知道 身体 发 育 的 原理 ， 所 以 体重 会 
影响 身高 在 理论 上 不 太 可 能 。 但 如 果 你 要 科学 的 证 据 ， 那 该 怎么 证 明 呢 ? 
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我 可 以 通过 一 个 基本 的 实验 设计 , 来 检验 “体重 会 影响 身高 ”这 一 假设 。 实 验 设计 必须 有 一 








个 对 照 组 ， 且 被 试 的 分 配 必须 随机 。 在 这 种 情况 下 发 现 的 任何 相关 都 可 能 是 因果 相关 。 在 我 的 研 
究 中 ， 我 会 创建 两 个 组 。 
e@ 第 1 组 





30 名 大 一 新 生 ， 是 从 我 工作 的 中 西部 大 学 ( Midwestern University ) 这 一 总 体 中 招募 的 。 这 
组 是 实验 组 ， 我 会 增加 他 们 的 体重 ， 然 后 测量 他 们 的 身高 是 否 有 所 增加 。 



































e@ 第 2 组 
30 名 大 一 新 生 ,， 也 是 从 我 工作 的 中 西部 大 学 这 一 总 体 中 招募 的 。 这 组 是 控制 组 , 我 不 会 对 他 
们 的 体重 进行 任何 操控 ， 然 后 测量 他 们 的 身高 是 否 发 生 改变 。 


”在 这 一 设计 中 ， 科 学 家 将 体重 称 作 独立 变量 ( 因为 我 们 不 关心 是 什么 引发 体重 变 
电 化 )， 将 身高 称 作 因 变 量 ( 因为 我 们 想 知道 它 是 否 依赖 于 独立 变量 ， 或 是 由 独立 变 
量 引 发 的 )。 


因为 这 一 设计 符合 实验 设计 的 标准 ， 所 以 我 们 能 将 所 发 现 的 任何 相关 视 为 因果 关系 的 证 明 。 


1.9.3 抵御 对 效 度 的 威胁 

研究 结论 分 为 两 类 。 它 们 关系 到 可 否 做 出 因果 声明 ， 以 及 该 因果 声明 确立 后 ,可 否 被 推广 到 
整个 总 体 或 是 实验 室 之 外 。 表 1-9 展 示 了 解释 研究 结果 时 需要 考虑 的 效 度 类 型 。 研 究 人 员 就 好 比 
跨栏 运动 员 ， 必 须 跨 越 这 些 栏杆 。 
表 1-9: 研究 结果 效 度 



































效 度 考虑 效 度 问题 

统计 结论 效 度 变量 间 存 在 相关 吗 

内 部 效 度 该 相关 是 因果 相关 吗 

构建 效 度 变量 间 的 因果 关系 是 否 因此 而 受到 影响 
外 部 效 度 这 因果 关系 到 处 都 存在 吗 











即便 研究 人 员 选 择 了 真正 的 实验 设计 , 他 们 依然 要 担心 结果 实际 上 或 许 不 是 由 于 一 个 变量 对 
另外 一 个 的 影响 造成 的 。 对 因果 结论 的 效 度 造 成 威胁 的 因素 有 很 多 , 但 幸好 ,研究 人 员 只 需要 想 
想 ， 就 辨识 出 很 多 这 样 的 威胁 并 开发 了 解决 方案 。 





” ”研究 人 员 对 群 组 设计 的 理解 、 用 来 描述 它们 的 术语 、 研 究 设计 中 对 效 度 威胁 的 确认 
BR.、 以 及 应 对 威胁 的 方法 ， 几 乎 完全 来 自 于 Cook 和 Campbell 两 人 影响 深远 的 论著 ， 见 
1.9.4 节 。 
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以 下 部 分 将 讨论 针对 因果 声明 以 及 普遍 性 声明 的 威胁 , 并 讲 到 若干 消除 威胁 的 方法 。 在 已 有 
研究 文献 中 识别 出 的 威胁 有 几 十 种 ,也 试图 给 出 应 对 方法 , 但 其 中 大 多 数 要 么 无 法 解决 , 要 么 可 
以 用 这 里 介绍 的 工具 来 解决 。 

@ 历史 

外 界 事件 能 够 影响 结果 ,一 个 解决 办 法 是 使 用 控制 组 (一 个 未 接受 药物 或 任何 干预 的 对 照 组 )， 
并 将 被 试 随机 分 配 。 这 个 方案 的 男 一 部 分 是 尽 可 能 控制 两 组 的 环境 ( 比如 在 实验 室 环境 下 )。 

@ 生物 成 熟 

在 一 项 研究 过 程 中 , 被 试 自然 地 生长 发 育 ， 所 以 改变 有 可 能 是 这 种 自然 发 展 导 致 的 。 对 实验 
组 和 控制 组 随机 分 配 被 试 能 很 好 地 解决 这 个 问题 。 

@ 选择 

在 分 配 被 试 时 可 能 存在 系统 性 偏差 。 解 决 的 办 法 是 随机 分 配 被 试 。 

e@ 测试 

只 进行 一 场 预测 试 也 许 会 影响 研究 变量 的 水 平 。 创建 一 个 对 照 组 ， 对 两 组 都 进行 预测 试 ， 这 
样 两 组 中 的 任何 改变 都 是 等 同 的 。 还 有 , 要 对 两 组 随机 分 配 被 坛 。( 你 开始 看 出 某 种 模式 了 吗 ? ) 

@ 测试 设备 

在 测量 中 可 能 会 有 系统 性 偏差 。 解 决 办 法 是 使 用 有 效 的 、 标 准 化 的 、 客 观 的 分 数 测试 。 

e@ 埠 桑 (Hawthorne ) 效应 

被 试 知 道 自己 在 参加 实验 的 意识 也 许 会 影响 结果 。 为 了 应 对 这 个 问题 ,你 可 以 限制 被 试 对 你 
期 望 的 实验 结果 的 认 知 ， 或 者 执行 一 场 双 育 人 研究 ( double-blind study )， 即 被 坛 和 研究 人 员 都 不 知 
道 给 予 被 试 的 是 什么 刺激 。 

人 研究 设计 的 效 度 以 及 任何 一 种 因果 关系 声明 的 效 度 , 都 类 似 于 测量 中 的 效 度 声明 [Hack #28]。 
这 样 的 讨论 是 开放 和 无 止境 的 , 效 度 结论 依赖 于 对 手边 证 据 的 合理 检验 , 以 及 对 什么 结论 看 似 合 
理 的 考虑 。 
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1 1.10 “敏锐 识别 效应 值 
#10 你 刚 读 到 一 条 令 人 震 尺 的 科学 新 发 现 ,但 这 真 的 是 一 个 重大 发 现 吗 ? 通过 对 效应 值 的 
解读 ， 你 能 判断 这 类 声明 (并 缺 乏 这 关 声 明 ) 对 你 完 竟 有 多 重要 。 


大 多 数 非 科 学 出 版 物 、 电 视 上 、 电 台 里 ,甚至 网 络 上 报道 的 科学 发 现 总 是 缺少 了 点 什么 。 虽 
然 这 些 媒 体 都 很 擅长 报告 “统计 显著 性 ”"， 但 这 并 不 足以 判断 是 否 存在 真正 重要 的 或 是 有 用 的 发 
现 。 一 项 大 规模 药物 研究 可 以 报告 “显著 ”结果 , 但 仍 未 发 现任 何 令 我 们 或 其 他 研究 者 感 兴趣 的 
东西 。 


正如 本 书 中 一 再 指出 的 那样 , 显著 性 [Hack #4] 只 是 意味 着 , 你 关于 样本 的 发 现在 总 体 中 可 能 
为 真 , 问题 是 , 仅 有 这 个 事实 并 不 足以 让 你 知道 自己 是 否 应 当 改 变 行为 , 开始 一 种 新 的 饮食 方式 ， 
改变 药物 或 者 重新 解读 你 的 世界 观 。 


要 想 根 据 任何 新 的 科学 报告 对 生活 和 现实 做 决策 ， 你 需要 知道 刚 被 揭露 出 的 相关 性 有 多 大 。 
品牌 A 比 品牌 B 究 竟 要 好 多 少 ” 用 有 意义 的 话 来 表达 ,男孩 和 女孩 的 SAI 成 绩 差 异 到 底 有 多 大 ? 每 
天 服用 半 片 阿司匹林 用 以 降低 心脏 病 发 作 的 风险 , 这 人 么 做 值得 吗 ? 即便 的 确 能 降低 上 述 风险 , 那 


De 


么 究竟 能 降低 多 少 ? 


这 种 相关 性 的 强度 也 应 该 以 某 种 标准 化 方式 来 表达 , 否则 就 没有 办 法 切实 判断 它 的 大 小 。 使 
用 效应 值 这 一 统计 工具 ， 能 让 你 敏锐 识别 效应 的 大 小 。 


























1.10.1 效应 值 无 处 不 在 

效应 值 是 一 个 标准 的 值 , 表示 两 个 变量 间 相 关 性 的 强度 。 在 讨论 如 何 辨 别 或 是 解读 效应 值 之 
前 ， 让 我 们 先 学 习 一 些 关 于 相关 性 和 统计 研究 的 基础 知识 。 

统计 人 研究 总 是 对 变量 间 的 相关 性 感 兴 趣 。 比 如 相关 系数 , 它 是 体现 两 组 分 数 间 关系 强度 和 方 
向 的 指数 [Hack #11]。 测 量 关 系 的 统计 方法 包括 t 检 验 [Hack #17] 和 方差 分 析 ， 这 是 一 次 性 对 比 多 
组 的 一 种 方法 。 它 们 虽然 不 是 很 明显 ， 却 依然 有 效 。 





























即使 是 用 来 比照 不 同 组 的 方法 ， 依 旧 对 变量 间 的 关系 感 兴趣 。 比 如 ， 在 t 检 验 中 ， 
甩 一 个 显著 性 结果 意味 着 一 个 人 在 哪个 组 至 关 重要 。 换 句 话说 ， 在 独立 变量 (定义 群 
组 ) 和 因 变量 ( 测量 结果 ) 间 存 在 关联 。 
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1.10.2 ”发 现 或 计算 效应 值 


这 个 Hack 关 于 发 现 和 解读 效应 值 ， 以 便 判 断 大 众 媒体 或 科学 论著 所 报告 的 科学 发 现 的 意义 。 
通常 情况 下 效应 值 会 直接 报告 出 来 ， 你 只 需要 知道 如 何 解 释 它 。 其 他 时 候 ， 虽 没有 报告 效应 值 ， 
但 提供 了 足够 的 信息 能 让 你 算出 效应 值 。 

效应 值 的 报告 方式 通常 有 三 种 类 型 。 它们 的 区 别 在 于 使 用 方法 的 不 同 以 及 这 些 方法 量化 信息 
的 方式 不 同 。 在 每 种 情况 下 ， 效 应 值 可 被 解读 为 对 “变量 间 关 系 的 大 小 ”的 估计 。 下 面 分 别 对 三 
种 类 型 的 效应 值 加 以 介绍 。 

@ 相关 系数 

相关 ， 用 小 写 r 来 表示 ， 其 本 身 已 经 是 对 变量 间 关 系 的 度量 ， 所 以 它 是 一 种 效应 值 。 因 为 相 
关 可 以 是 负 的 ， 所 以 ， 有 时 候 会 对 r 值 进行 平方 得 到 一 个 大 于 0 的 值 。 因 此 ，z- 被 解释 为 变量 共享 
的 “方差 比例 ”。 

ed 


这 个 值 用 a 来 表示 ， 够 奇怪 的 ， 它 归纳 了 {检验 中 所 使 用 的 两 组 平均 数 的 差异 。 其 计算 是 通过 
两 组 平均 数 的 差异 除 以 两 组 平均 标准 差 而 得 到 的 。 

























































































x 这 儿 还 有 另 一 种 计算 d 值 的 方式 ， 简 单 、 超 级 有 趣 、 相 当 酷 、 干 净利 落 : 








| 第 1 组 样本 大 小 + 第 2 组 样本 大 小 
(第 1 组 样本 大 小 )( 第 2 组 样本 大 小 ) 








@ 7 
方差 分 析 结 果 中 报告 的 效应 值 最 常用 7 来 表示 。 跟 ”类 似 ， 它 被 解释 为 因 变量 ( 结果 变量 ) 
对 独立 变量 〈 你 所 在 的 组 ) 贡献 的 “方差 比例 ”。 


1.10.3 ”解读 效应 值 


关于 显著 性 水 平 , 统计 学 家 们 已 经 有 了 一 些 判 别 何 为 “良好 ”的 指标 。 比 如 ， 大 多 数 统计 研 
究 人 员 和 希望 显著 性 水 平 达到 0.05 或 更 低 。 尽管 在 效应 值 的 问题 上 , 并 不 总 是 存在 明确 的 好 坏 之 分 ， 
但 要 分 辨 效应 值 是 大 、 中 还 是 小 ， 依 然 有 一 些 标准 可 循 。 

绝 大 部 分 情况 下 ,判定 大 、 中 和 小 的 标准 ， 应 视 实 际 研究 中 通常 发 现 的 效应 值 而 定 。 如 果 某 
个 特定 效应 值 大 到 极 少见 于 已 有 的 研究 结果 , 那 它 就 被 视 为 大 。 如 果 效 应 小 且 在 实际 研究 中 常见 ， 
那么 它 就 被 视 为 小 。 
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然而 ,在 解读 研究 结果 时 ， 你 应 该 自己 决定 ,效应 值 达到 多 大 才能 引起 你 的 兴趣 。 这 取决 于 
调查 研究 的 领域 。 表 1-10 提 供 了 判别 效应 值 的 经 验 法 则 。 


表 1-10: 判别 效应 值 的 标准 





效应 值 小 中 大 

r +/-0.10 +/-0.30 +/-0.50 
7 0.01 0.09 0.25 

d 0.2 0.5 0.8 

11 0.01 0.06 0.14 


1.10.4 解读 研究 发 现 


在 讨论 研究 结果 时 ， 关注 效应 值 的 好 处 在 于 : 能 让 每 个 人 都 大 致 了 解 ， 给 定 的 研究 变量 (或 
干预 、 药 物 、 教 学 技术 等 ) 对 现实 的 实际 影响 有 多 大 。 因 为 报告 效应 值 的 时 候 ， 通 常 不 会 报告 概 
率 信 息 〈 显 著 性 水 平 )， 所 以 搭配 了 显著 性 水 平 报告 的 效应 值 是 非常 有 用 的 。 这 样 ， 你 可 以 回答 
两 个 问题 。 

口 这 种 相关 可 能 存在 于 总 体 中 吗 ? 
口 这 种 相关 有 和 多大? 

还 记得 前 面 的 例子 吗 ? 你 应 该 每 天 服用 半 片 阿司匹林 以 降低 心脏 病 发 作 的 风险 吗 ? 20 世 纪 
80 年 代 未 有 一 项 广为人知 的 研究 ,发 现 了 这 两 个 变量 在 统计 学 上 的 显著 相关 。 当 然 ,， 在 做 任何 类 
似 的 决定 前 ,你 应 该 先 和 你 的 医生 谈 谈 , 但 你 同样 应 该 获取 尽 可 能 多 的 信息 来 帮 你 做 出 决定 。 现 
在 让 我 们 借助 效应 值 信息 来 解读 此 类 发 现 。 

以 下 是 媒体 的 报道 : 


22 071 名 内 科 医 生 组 成 的 样本 被 随机 分 为 两 组 。 很 长 一 段 时 间 内 ， 半 数 医 生 每 天 服 
用 阿司匹林 ,同时 另外 半数 服用 外 观 和 味道 与 阿司匹林 相似 的 安奈 剂 。 实 验 期 结束 时 ( 实 
际 上 较 早 就 结束 了 ， 因 为 大 家 认为 阿司匹林 的 药 效 实在 很 强 )， 服 用 阿司匹林 的 医生 患 
心脏 病 的 几率 为 服用 安慰 剂 组 医生 的 一 半 。 服用 安慰 剂 组 , 有 1.71% 的 人 有 心脏 病 发 作 ， 
而 阿司匹林 组 医生 的 发 病 比 例 仅 有 大 约 1% (0.94% )。 这 一 发 现在 统计 学 上 具有 显著 性 。 


对 上 述 发 现 的 “清楚 ”解释 是 ,服用 阿司匹林 可 以 使 心脏 病 发 作 的 几率 减 半 。 假设 这 个 研究 
具有 代表 性 ， 而 且 参 与 其 中 的 医生 们 和 你 我 极其 相似 ， 那 么 这 个 解释 可 谓 相当 正确 。 

对 于 该 发 现 的 男 一 种 解读 方式 ,是 看 阿司匹林 服用 的 效应 值 。 通过 比例 比较 公式 得 到 , 该 研 
究 的 效应 值 为 0.06 个 标准 差 ， 即 4 为 0.06。 根 据 表 1-10 中 的 效应 值 判 别 标准 ， 该 效应 值 应 该 解读 为 
小 , 真 的 非常 小 ,这 样 的 解读 表明 在 服用 阿司匹林 和 心脏 病 发 作 之 间 的 确 存 在 一 个 非常 小 的 相关 。 
相关 性 确实 存在 ， 只 是 不 太 强 。 
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这 个 问题 还 可 以 这 样 看 : 首先 , 在 一 段 给 定期 间 内 , 心脏 病 发 作 的 几率 相当 小 。 研 究 中 98.76% 
的 人 没有 心脏 病 发 作 , 不 管 他 们 是 否 服 用 阿司匹林 。 虽然 服 用 阿司匹林 的 确 会 降低 心脏 病 发 作 的 
几率 ， 但 这 个 下 降 只 是 从 微小 到 更 小 一 点 而 已 。 一 个 类 似 的 情形 是 : 和 没有 购买 彩票 的 人 相 比 ， 
如 果 你 大 量 购买 彩票 ， 中 奖 几 率 会 进一步 提升 ， 但 这 个 几率 依然 很 小 。 














1.10.5 生效 原理 


一 个 研究 人 员 可 能 取得 显著 性 结果 , 但 仍然 没有 发 现任 何 令 人 激动 的 东西 。 这 是 因为 显著 性 
只 能 告诉 你 样本 结果 很 可 能 不 是 偶然 发 生 的 。 这 结果 是 真实 的 ,也 可 能 存在 于 总 体 中 。 如 果 你 在 
两 个 变量 间或 是 用 药 和 治疗 结果 间 找 到 细微 的 相关 , 那么 这 种 相关 可 能 由 于 太 小 以 至 于 没 人 对 其 
真正 感 兴 趣 。 药 效 或 许 是 真 的 , 但 很 弱 ， 所 以 不 值得 推荐 给 病人 。A 和 B 的 相关 可 能 大 于 0, 但 它 
的 值 还 是 太 小 ， 对 理解 两 个 变量 中 的 任何 一 个 都 没有 太 大 的 帮助 。 


现代 研究 人 员 依 然 热衷 于 寻找 自己 的 发 现 中 是 否 存 在 统计 显著 性 , 但 他 们 应 该 几乎 总 是 报告 
并 讨论 效应 值 。 如 果 报 告 了 效应 值 ， 你 就 能 够 解读 它 。 如 果 没 有 报告 效应 值 ， 你 也 总 是 能 从 公 诸 
于 众 的 研究 报告 中 挖掘 所 需 信息 ,自己 计 算出 效应 值 。 其 中 的 绝妙 之 处 在 于 ,你 也 许 比 报告 这 些 
发 现 的 媒体 ， 甚 至 比 摘 这 项 研究 的 科学 家 自己 ， 更 懂得 该 发 现 的 重要 性 。 
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我 们 周围 存在 着 无 形 的 关系 网 。 变 量 A 引 发 变量 B ， 变 量 B 影 响 了 变量 C， 变 量 C 完 全 独立 于 
变量 D , 除非 变量 E 也 参与 进来 。 本 章 介 绍 的 Hack 能 让 你 发 现 这 些 联系 并 准确 描述 它们 。 这 些 Hack 
揭示 了 人 们 做 事 的 内 在 原因 和 事物 之 所 以 成 为 现在 这 个 样子 的 原因 。 

一 个 特质 与 另 一 个 特质 之 间 的 联系 , 因 与 果 之 间 的 联系 , 都 是 可 以 通过 正确 的 技巧 轻松 揭示 
的 关系 。 我 们 从 确认 任何 关联 的 强度 [Hack #11] 开 始 ， 然 后 画 出 它 的 样子 [Hack #12]。 接 下 来 ， 用 
你 所 掌握 的 相关 性 知识 进行 预测 [Hack #13]， 再 提高 这 些 预 测 的 准确 性 [Hack#14]。 有 些 相 关 是 通过 
观察 非 预 期 结果 的 发 生 [Hack #15 和 Hack #16] 或 注意 组 间 的 真正 差异 [Hack #17] 而 显现 出 来 的 。 

因为 我 们 无 法 测量 自己 可 能 感 兴趣 的 每 个 人 、 每 条 鱼 或 是 每 棵 松树 , 所 以 要 依赖 有 代表 性 的 
样本 [Hack#19] 为 我 们 提供 观测 值 。 然 而, 样本 有 可 能 产生 误导 [Hack #18]， 也 可 能 以 令 人 意 想 不 
到 的 绝妙 方式 起 作用 [Hack #20]。 

要 想 与 别人 分 享 你 的 发 现 或 理解 这 些 发 现 对 你 的 意义 , 你 需要 注意 避免 受骗 ,也 不 要 欺骗 他 
人 。 小 心 不 要 误解 任何 数字 [Hack #1] 或 图 像 [Hack #22]。 


将 这 些 方 法 统统 打包 带好 ， 把 自己 武装 起 来 ， 去 发 现 那些 有 竺 发现 的 事物 吧 。 
























































Lm 2.1 ”发现 相关 


有 扬 示 过 间 各 种 元 形 的 联系 ， 不 过 是 记录 观测 值 并 计算 出 那些 奇妙 而 神秘 的 相关 系 芍 而 已 。 


关于 人 们 为 何 产生 如 此 这 般 的 感受 、 做 出 如 此 这 般 的 事情 ， 你 可 能 会 做 出 形形色色 的 假设 。 
统计 研究 人 员 把 这 些 假设 称 作 变 量 间 相 关 性 的 假设 。 
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不 管 科学 界 怎么 称呼 它 ,， 你 在 现实 生活 中 很 可 能 就 是 这 么 做 的 。 你 可 能 会 对 态度 和 行为 、 态 
度 和 态度 或 是 行为 和 行为 之 间 的 关联 进行 估计 。 你 可 能 试图 理解 周围 世界 中 的 人 , 因而 随便 做 出 
假设 ; 或 者 你 是 一 名 市 场 营销 专家 , 需要 借 此 来 理解 顾客 ; 又 或 者 你 是 一 名 心理 学 研究 生 ， 正 为 
完成 一 项 针对 自尊 和 抑郁 的 相关 性 进行 统计 分 析 的 课堂 作业 而 伤 脑筋 。 


在 统计 学 里 , 这样 的 关系 称 作 相关 。 描 述 关 系 大 小 的 数字 是 相关 系数 。 通 过 计算 这 个 有 用 的 
值 ， 你 能 够 获得 任何 有 关 “ 关 系 ”问题 的 答案 ( 除了 恋爱 关系 ， 那 只 能 靠 你 自己 了 )。 
























































2.1.1 检验 关系 假设 


想象 有 这 么 一 个 研究 : 美国 奶酪 蛋糕 零售 协会 ( American Cheesecake Sellers Association ) 的 
一 名 研究 人 员 做 出 假设 , 认为 人 们 喜欢 奶酪 蛋糕 是 因为 爱 吃 奶酪 。 也 就 是 说 ,他 猜测 人 们 对 奶酪 
的 态度 和 对 奶酪 蛋糕 的 态度 之 间 存 在 相关 。 如 果 他 的 假设 最 终 被 证 明 是 对 的 , 那么 他 将 从 美国 奶 
酷爱 好 者 协会 ( American Cheese Lovers Association ) 购买 大 量 的 邮寄 地 址 , 向 这 些 人 发 送 宣传 册 ， 
介绍 奶 酷 蛋糕 的 保健 功效 。 如 果 他 是 对 的 ， 销 售 量 将 如 火箭 般 蹄 升 ! 

为 了 检验 自己 的 假设 , 他 创建 了 两 项 调查 研究 。 其 中 一 项 是 让 受 访 者 表述 对 奶酪 的 感觉 , 另 
一 项 则 询问 他 们 对 奶酪 蛋糕 的 感觉 。50 分 表示 这 个 人 喜欢 奶酪 ( 或 奶酪 蛋糕 )，0 分 表示 这 个 人 讨 
大 奶酪 蛋糕 (或 奶 酷 )。 表 2-1 显 示 了 他 上 班 途中 在 公交 车 上 收集 的 5 个 人 的 数据 。 

















表 2-1: 关于 对 待 奶 酷 和 奶 酷 蛋 糕 的 态度 之 间 相 关 性 的 数据 





受 访 者 对 奶酪 的 态度 对 奶酪 蛋糕 的 态度 
拉 里 50 36 
莫 伊 45 35 
乔 30 22 
塞 夫 30 25 
格 劳 乔 10 20 

















看 看 这 些 数据 ， 两 个 变量 间 看 起 来 是 否 存在 相关 ? ( 看 吧 ， 我 会 给 你 30 秒 时 间 。) 

我 会 说 二 者 之 间 存 在 一 种 非常 清晰 的 关系 。 在 奶酪 量 表 上 得 分 高 的 人 , 同样 在 奶酪 蛋糕 量 表 
上 得 分 高 。 当 然 , 这 些 人 在 两 个 量 表 上 的 得 分 并 非 完 全 相同 ， 甚 至 分 数 高 低 顺序 也 不 相同 , 但 是 
相对 来 说 , 每 个 人 在 两 张 态度 量 表 上 相对 于 其 他 人 所 处 的 位 置 大 致 相同 。 那 位 奶酪 蛋糕 零售 协会 
的 研究 人 员 为 他 的 假设 找到 了 支持 。 

















2.1.2 ”计算 相关 系数 
只 对 样本 中 的 两 列 数据 扫 上 几 眼 ， 并 不 足以 确 知 两 件 事 之 间 是 否 存在 相关 。 在 这 个 例子 中 ， 
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市 场 营销 专家 想 用 一 个 数字 更 加 准确 地 描述 所 发 现 的 关系 。 

相关 系数 考虑 了 我 们 在 观察 表 2-1 中 两 列 数字 时 使 用 的 所 有 信息 , 并 判断 其 间 是 否 存在 相关 。 
相关 系数 的 计算 公式 包括 以 下 几 个 步骤 。 

(1) 查看 一 列 中 的 每 个 分 数 。 

(2) 查看 每 个 分 数 和 本 列 平均 数 的 距离 。 

(3) 查看 男 一 列 中 与 其 对 应 的 分 数 与 平均 值 的 距离 。 

(4) 将 这 一 对 距离 数字 相 乘 。 

(5) 计算 乘积 结果 的 平均 数 。 

如 果 这 是 本 统计 教科 书 , 我 就 有 必要 展示 略为 复杂 的 相关 系数 计算 公式 。 称 它 “ 略 为 复杂 的 ” 
算是 轻 摘 淡 写 。 坦 白 讲 ,那些 公式 非常 可 怕 。 相 信 我 ,为 了 你 好 ,我 不 会 把 这 些 可 怕 的 公式 展示 
给 你 看 ， 而 是 展示 一 个 看 起 来 令 人 愉快 的 、 友 好 的 公式 ( 而 且 同 样 有 效 ): 


2(2.2,) 
N-1l 


其 中 2Z 表 示 2Z 分 数 ， 是 一 个 分 数 离 平均 数 的 距离 。 随 后 ,将 这 些 距 离 除 以 分 布 的 标准 差 。 
此 ,Z 表 示 第 一 列 的 所 有 2 分 数 ，Z, 表 示 第 二 列 的 所 有 2 分 数 。2Z.2Z, 表 示 将 它们 相 乘 。> 符 号 表 
示 相 加 。 所 以 ， 此 方程 的 意思 是 把 所 有 配对 的 Z 分 数 相 乘 ， 并 把 这 些 乘积 相 加 ， 然 后 除 以 配对 
数 (V) 减 1。 

平均 数 是 一 组 分 数 的 算术 平均 。 其 计算 方法 是 将 所 有 数字 相 加 并 除 以 分 数 的 总 数 。 一 组 数 的 
标准 差 是 各 个 分 数 距 平均 数 的 平均 距离 。 

在 使 用 我 们 的 相关 公式 计算 Z 分 数 前 ， 我 需要 知道 每 列 数据 的 平均 数 和 标准 差 。 计 算 这 些 关 
键 值 的 公式 在 “ 仅 用 两 个 数字 描述 世界 ”[Hack #2] 中 已 有 介绍 。 以 下 是 本 例 中 两 个 变量 的 平均 数 
和 标准 差 。 

@ 对 奶酪 的 态度 

平均 数 =33; 标准 差 =15.65 

@ 对 奶酪 蛋糕 的 态度 

平均 数 =27.6; 标准 差 =7.44 

表 2-2 给 出 了 一 些 针 对 奶酪 态度 数据 所 做 的 计算 。 
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表 2-2: 对 于 奶 酷 和 奶 酷 蛋糕 的 态度 之 间 相关 性 的 计算 
受 访 者 。 ”对 奶酪 的 态度 对 奶 酷 蛋 糕 的 态度 奶酪 的 Z 分 数 奶酪 蛋糕 的 2 分数 Z 分 数 的 乘积 





拉 里 50 36 1.09 1.13 1.23 
莫 伊 45 35 0.77 0.99 0.76 
乔 30 22 -0.19 -0.75 0.14 
塞 夫 30 25 -0.19 -0.35 0.07 
格 劳 乔 10 20 -1.47 —1.02 1.50 


相关 系数 为 0.93， 非 常 接近 于 1。1 是 最 强 的 正 相 关 ， 所 以 人 们 对 奶酪 - 奶 酷 蛋糕 的 态度 之 间 
存在 非常 强 的 相关 。 


2.1.3 ”解释 相关 系数 


有 点 神奇 的 是 , 相关 公式 的 计算 产生 一 个 范围 在 -1.00~+1.00 的 数 , 用 以 表明 两 个 变量 间 的 关 
系 强度 。 正 号 (+) 表示 正 向 相关 ， 即 随 着 其 中 一 个 值 的 增加 ， 另 外 一 个 值 也 增加 。 负 号 (- ) 表 
示 反 向 相关 ， 即 随 着 其 中 一 个 值 的 增加 ， 另 外 一 个 值 减少 。 需 要 指出 的 一 个 重点 是 : 相关 系数 提 
供 的 是 两 个 变量 间 线 性 关系 强度 的 标准 度量 [Hack #12]。 

相关 的 方向 (不 管 是 正 的 还 是 负 的 ) 是 标尺 方向 的 虚拟 结果 , 人 们 选取 这 个 标尺 来 度量 变量 。 
换 名 话说, 强 相关 也 可 以 是 负 的 。 就 拿 高 尔 夫 球技 和 高 尔 夫 平均 得 分 之 间 相 关 性 的 度量 来 说 , 球 
技 越 高 ， 分 数 越 低 ， 但 你 依然 可 以 预见 二 者 之 间 存 在 一 个 强 相关 。 















































2.1.4 统计 显著 性 和 相关 


我 们 的 市 场 营 销 专家 可 能 同样 对 “样本 的 相关 性 是 否 大 到 有 可 能 抽取 自 相 关 性 大 于 零 的 总 
体 ” 这 个 问题 感 兴趣 。 换 句 话说 ,我 们 在 样本 中 发 现 的 相关 是 否 足够 大 ， 以 至 于 它 肯定 来 自 于 一 
个 变量 间 至 少 存在 某 种 关系 的 总 体 ? 

相 比 从 小 样本 《〈 比如 前 述 的 5 位 公交 乘客 ) 中 得 到 的 相关 ， 本 例 中 的 市 场 研究 人 员 更 相信 由 
大 样本 中 获得 的 相关 。 如 果 他 将 这 个 相关 呈报 给 老板 ,但 结论 对 大 多 数 人 并 不 适用 , 那么 他 说 不 
定 要 被 炒 鲜 鱼 ， 只 能 靠 开 小 型 客 货车 卖 奶酪 重 糕 来 谋生 了 。 

表 2-3 展 示 了 样本 中 相关 系数 必须 达到 多 大 ， 统 计 学 家 才能 够 确定 其 代表 的 总 体 中 存在 大 于 
零 的 相关 。 






































表 2-3: 可 能 并 非 偶然 出 现 的 相关 


样本 量 可 被 视 为 统计 相关 的 最 小 相关 
5 0.88 
10 0.63 
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( 续 ) 
样本 量 可 被 视 为 统计 相关 的 最 小 相关 
15 0.51 
20 0.44 
25 0.40 
30 0.38 
60 0.26 
100 0.20 

















就 我 们 的 5 人 样本 而 言 ， 任 何 大 于 或 等 于 0.88 的 相关 系数 会 被 认为 统计 学 显著 ( 意思 是 “ 相 2 
关 性 大 到 很 可 能 存在 于 样本 所 代表 的 总 体 中 ”)。 





2.1.5 ”其 他 生效 领域 
只 要 满足 某 些 条 件 ， 你 就 能 够 计算 作为 两 个 变量 间 关系 强度 度量 的 相关 系数 。 


一 定 能 够 以 这 样 一 种 方式 测量 变量 : 数字 有 实际 的 意义 且 能 够 代表 一 些 基 本 的 连续 概 
A 连续 变量 的 例子 有 态度 、 情 感 、 知 识 、 技 能 ,那些 你 能 够 计数 的 事物 ， 比 如 因为 喜 
爱 奶 柳 蛋 楼 导致 体重 增加 的 磅 数 。 《如 果 你 测 | 量 的 事物 不 是 连续 的 ， 就 像 存 在 不 同类 别 的 
本 比如 性 别 或 党 派 ， 你 依然 能 够 计算 相关 ， 只 不 过 不 用 这 里 展示 的 公式 。) 

变量 必须 真正 存在 差异 。 如 果 每 个 人 对 奶 酷 的 感觉 都 一 样 ， 你 就 不 能 计算 对 奶 酷 ( 也 可 
ee 的 态度 相关 。 数 学 需要 差异 性 。 
口 只 有 在 样本 是 从 总 体 中 随机 抽取 的 情况 下 ， 达 到 统计 显著 所 需 的 最 小 相关 系数 大 小 〈 如 

表 2-3 所 示 ) 才 是 精确 的 。 研 究 人 员 《〈 比如 我 们 的 奶酪 蛋 糕 营销 人 员 ) 必须 判断 他 们 的 样 

本 是 否 像 随机 样本 那样 具有 代表 性 。 






























































2.1.6 ”关于 相关 的 严重 警告 
我 们 很 容易 倾向 于 将 相关 证 据 作 为 因果 关系 的 证 据 。 当 然 ， 两 件 事情 可 以 有 关联 , 却 不 属于 
因果 关系 ， 造 成 这 种 情形 的 原因 可 能 是 多 种 多 样 的 。 


比如 说 , 在 对 奶 酷 和 奶酪 蛋糕 的 态度 之 间 的 这 种 强 相 关 之 下 , 你 也 许 会 得 出 结论 说 : 一 个 人 
对 奶酪 的 喜爱 导致 他 喜欢 奶酪 蛋 糕 ， 因 为 奶酪 蛋 糕 里 有 奶 酷 。 但 我 们 也 可 进行 非 因果 解释 : 喜爱 
奶 酷 的 人 之 所 以 同时 喜欢 奶酪 蛋糕 ， 也 许 是 因为 他 们 喜欢 各 种 软 请 可 口 的 食物 。 


2 2.2 相关 图 表 
不 论 何 时 ， 只 要 发 现 并 且 定 义 了 两 个 变量 间 的 关系 ， 我 们 就 能 用 其 中 一 个 变量 去 预 


测 史 一 个 变量 。 画 一 条 回归 线 ， 你 就 可 以 描绘 出 相关 并 做 出 预测 。 
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假设 你 刚 被 任命 为 区 域 副 经 理 ， 负 责 堪萨斯 东北 部 太阳 花 湖 滨 黄 金 带 面积 为 100 00 平 方 英尺 
店面 的 冰淇淋 销售 。 恭 喜 你 ! 你 肩负 很 多 责任 ， 需 要 做 出 很 多 关于 如 何 最 大 化 利润 的 战略 决策 。 
你 面临 的 一 个 两 难 问题 是 : 是 否 需 要 开门 营业 。 上 店铺 一 开门 必定 要 消耗 金钱 和 资源 ， 如 果 你 那天 
没 卖 出 多 少 冰 淇 淋 甜 简 ， 可 能 都 不 值得 打开 你 那 油漆 鲜艳 的 胶合 板 售 货 窗口 。 

要 是 有 某 种 方法 ， 能 神奇 地 知道 任意 给 定 日 子 的 经 营 状况 , 那 就 好 了 。 作 为 一 名 统计 学 爱好 
者 ,你 认为 一 定 有 一 种 科学 的 方法 ， 无须 通 过 实际 开张 、 测 试 当 天 销售 情况 ,就 能 估 测 一 天 能 卖 
出 多 少 甜 简 。 你 运气 不 错 。 的 确 有 一 种 办 法 能 通过 其 他 信息 来 估计 某 个 变量 ( 如 冰淇淋 销量 ) 的 
分 数 或 值 。 

关键 是 你 所 利用 的 其 他 信息 必须 来 自 和 被 关注 变量 有 关联 的 变量 ,通过 将 已 知 天 数 里 两 个 变 
量 之 间 的 关系 画 成 一 条 线 ， 你 可 以 把 这 条 线 看 作 延 伸 到 未 来 (或 是 过 去 )， 从 而 预测 未 知 时 间 点 
会 发 生 什么 。 这 样 的 图 表 工 具 叫 做 回归 线 。 














































































































2.2.1 勾画 未 来 


善于 观察 的 人 总 能 在 变量 间 发 现 相 关 性 [Hack #11]。 然 而 ， 知 道 存 在 相关 性 的 好 处 不 仅 限 于 
描述 性 统计 。 

想象 你 有 太阳 花 湖畔 活动 的 相关 数据 。 除 了 其 他 因素 , 你 已 经 收集 了 前 任 区 域 副 经 理 任 期 内 
的 冰淇淋 销量 〈 用 冰淇淋 甜 简 数 表示 ) 和 每 天 的 最 高 气温 ( 用 华氏 温度 来 表示 )。 代 表 温 度 和 对 
冰淇淋 购买 欲 之 间 相 关 性 的 相关 系数 应 该 是 正 向 的 并 且 非 常 大 。 也 就 是 说 ， 当 温度 升 高 时 ， 销 量 
很 可 能 随 之 增加 。 
直觉 上 来 说 ,依据 过 往 经 验 ， 你 看 着 温度 计 ， 就 能 大 概 知道 那天 冰淇淋 摊点 的 忙碌 程度 。 只 
要 你 知道 两 个 变量 之 间 存 在 正 向 或 负 向 的 关系 , 可 以 合理 地 说 , 知道 一 个 变量 的 分 数 你 就 能 大 致 
了 解 男 外 一 个 变量 的 分 数 。 

如 果 你 发 现 两 个 变量 之 间 存 在 类 似 的 关系 , 便 可 合理 假定 这 两 个 变量 间 的 关系 是 线性 的 。 换 
句 话 说， 如 果 你 画 一 张 图 ， 将 一 个 变量 的 所 有 可 能 值 都 放 在 X 轴 上 沿 着 底部 的 水 平 线 )， 把 男 
一 个 变量 的 所 有 可 能 值 都 放 在 Y 轴 上 沿 着 边 的 垂直 线 )， 然 后 画 出 每 一 对 分 数 在 象限 中 的 对 应 
点 ， 结 果 是 那些 点 基本 呈 直 线 分 布 。 






























































2.2.2 ”连接 这 些 点 


图 2-1 展 示 了 一 种 用 图 形 来 表示 湖滨 气温 和 冰淇淋 销量 间 关 系 的 方法 。 
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A B 
图 6 四 6 
涝 6 © 下 6 
© 拒 5 
5 © 区 5 
70 80 90 100 和 70 80 90 100 
温度 温度 





图 2-1: 销量 和 温度 的 线性 关系 








图 A 基于 你 收集 到 的 历史 信息 ,用 点 来 体现 两 个 变量 的 值 。 例 如， 最低 点 意味 着 当 温 度 为 华氏 
70 度 时 , 卖 出 了 50 个 冰淇淋 甜 简 。 在 90 度 , 卖 出 了 60 个 冰淇淋 甜 简 。 我 们 看 到 一 个 非常 明显 的 模式 ， 
二 者 间 的 关系 在 图 上 看 起 来 像 一 条 直线 。 温 度 每 升 高 10 华 氏 度 , 甜 简 销量 就 增加 5 个 。 温度 每 升 高 1 
华氏 度 ， 甜 简 销 量 便 相应 增加 1/2 个 。 图 B 基 于 这 个 规则 画 了 一 条 线 。 该 线 将 每 个 点 贯穿 起 来 。 











在 图 2-1 中 , 分 析 图 B 能 让 我 们 初步 认识 到 回归 方程 的 强大 功用 。 这 条 线 包含 了 未 进行 数据 取 
样 的 区 域 。 例 如 ， 我 们 没有 温度 是 100 华 氏 度 的 数据 。 但 是 ， 有 了 回归 方程 ， 我 们 便 可 估计 可 能 
的 销量 。 如 果 我 们 在 100 度 标记 处 找到 直线 上 对 应 的 点 ， 那 这 个 点 看 起 来 和 65 个 甜 简 的 标记 相 匹 
配 。 使 用 这 个 回归 方程 ， 可 以 估计 在 华氏 100 度 的 天 气 里 ， 会 卖 出 65 个 冰淇淋 甜 简 。 我 们 同样 可 
以 佑 计较 低 温度 下 的 情况 。 图 2-1 表 明 ， 在 华氏 60 度 的 天 气 里 ,会 卖 出 45 个 甜 简 。 

















2.2.3 玩 “ 如 果 - 怎 样 ” 游 戏 








温度 和 甜 简 销 量 间 的 关系 可 以 用 数学 表达 式 来 表示 。 以 下 给 出 的 是 图 2-1 中 国 A 和 图 B 的 数据 。 





温 度 冰淇淋 甜 简 销量 
70 50 
80 55 
90 60 


那么 ， 让 我 们 看 看 如 何 用 数字 建立 描述 其 相关 性 的 方程 。 毕 竟 ， 回 归 线 是 统计 工具 。 注 意 ， 
如 果 以 70 度 作为 起 始点 ， 其 对 应 销量 为 530 个 甜 简 。 当 我 们 将 70 代 入 公式 ， 应 得 到 50 这 个 结果 。 同 
样 ， 代 和 人 80 应 得 到 55， 代 入 90 应 得 到 60。 











口 





我 用 这 些 数值 尝试 不 同 的 可 能 性 , 试图 摸索 出 输入 值 与 结果 值 之 间 的 适当 数学 关系 式 。 我 注 
意 到 ,“ 冰 淇 淋 销 量 ” 的 值 总 是 小 于 温度 变量 的 值 ， 所 以 我 想 要 一 个 能 够 减 小 温度 的 方程 。 线 性 
方程 需要 一 个 常量 ( 在 每 个 方程 中 都 使 用 的 某 个 值 ) 以 便 产 生 一 条 直线 ， 所 以 我 的 方程 里 也 需要 
有 个 常量 。 不 用 反复 试验 , 你 也 可 以 把 这 些 数 输入 到 统计 程序 , 比如 SPSS , 或 是 电子 表格 ( 如 excel 
表 ) 中 ,生成 正确 的 项 。 我 发 现下 面 这 个 公式 效果 不 错 : 
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甜 简 销 量 =15+( 温 度 x 0.50) 











从 代数 上 讲 ， 如 果 你 从 常量 开始 ， 加 上 一 些 仅 通过 基本 算术 运算 (比如 来 法 ) 改变 
的 标准 量 ， 就 能 定义 出 一 条 表现 在 图 上 的 直线 。 





“如 果 - 怎 样 ”是 个 运用 回归 线 来 玩 的 有 趣 游戏 。 在 一 端 输入 一 个 值 ， 就 会 在 另 一 端 得 到 一 个 
估计 值 ; 甚至 一 些 不 切实 际 的 情形 也 能 获得 答案 。 在 线 上 放 一 些 疯 狂 的 数值 ， 比 如 200 度 ， 你 依 
然 会 得 到 甜 简 销 量 的 估计 值 ，115 个 ! 

针对 这 种 关系 的 回归 方程 ,描述 的 是 一 条 能 直观 体现 该 关系 的 直线 。 现 实 中 , 数据 之 间 的 关 
系 很 少 像 我 们 这 个 例子 中 那么 清晰 。( 我 们 这 个 虚拟 小 数据 集 的 相关 系数 是 完美 的 1.0。) 




















在 统计 学 里 ， 回 归 方 程 使 用 两 组 变量 分 数 的 相关 系数 、 平 均 数 以 及 标准 差 ， 不 考虑 
数据 集中 相关 的 强度 。“ 用 一 个 变量 预测 另外 一 个 ”[Hack#13] 说 的 就 是 建立 回归 方 
程 的 统计 学 方法 。 


2.2.4 生效 原理 


这 类 回归 估计 的 准确 性 有 赖 于 儿 个 重要 因素 。 首 先 , 变量 间 的 相关 必须 相当 大 。 微小 相关 产 
生 的 点 阵 式 图 形 根 本 无 法 形成 直线 , 通过 这 些 点 描绘 出 的 回归 线 丢 失 了 很 多 点 , 并 不 准确 。 可 惜 ， 
在 社会 科学 领域 中 ,我 们 难以 找到 太 多 真正 的 强 相关 ,所 以 回归 预测 往往 会 产生 一 定数 量 的 误差 。 
在 统计 学 里 ， 误 差 是 必然 存在 的 。 

其 次 ,相关 必须 至 少 是 线性 的 。 在 我 们 所 举 的 冰淇淋 甜 简 的 例子 里 ， 如 果 在 回归 线 上 变量 ; 
系 发 生 了 质 的 改变 , 那么 这 条 回归 线 就 会 错失 一 些 数据 。 幸 好 ,自然 界 里 的 相关 大 多 是 线性 或 者 
接近 线性 的 。 
























































2.2.5 不 适用 领域 

实际 的 相关 不 一 定 是 纯粹 线性 的 , 但 只 要 基本 上 属于 线性 , 那么 回归 分 析 就 相当 有 效 。 比如， 
在 我 们 关于 冰淇淋 的 例子 当中 ,可 能 温度 每 上 升 一 度 , 销量 就 有 所 增加 。 如 果 在 量 表 的 每 一 处 增 
量 都 相同 , 那 我 们 将 会 看 到 一 种 线性 关系 。 但 是 , 在 某 一 温度 值 上 销量 又 增 也 是 有 可 能 的 。 或 许 ， 
一 旦 湖畔 的 气温 超过 华氏 90 度 ， 人 们 就 会 蜂拥 去 买 甜 简 冰 淇 洒 ， 让 自己 凉快 凉快。 

图 2-2 中 的 图 C 和 图 D 显 示 了 相关 并 非 纯 线性 时 ， 将 是 怎样 的 情况 。 

按照 线性 回归 的 要 求 ， 回 归 方程 总 是 生成 一 条 直线 ,在 这 种 情况 下 ,图 中 两 个 点 正好 落 在 直 
线 上 , 但 还 有 一 个 点 不 在 直线 上 。 通 过 夯 相 关 图 来 解释 数据 ， 这 条 线 完成 得 很 好 , 但 因为 相关 不 










































































是 线性 的 ， 所 以 回归 方程 产生 了 一 些 误 差 。 
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图 2-2: 非 线性 相关 


天 十 2.3 用 一 个 变量 预测 另 一 个 变量 
| 筒 单线 性 回归 是 一 个 强大 的 工具 ,用 未 测量 你 看 不 见 的 事物 疼 预 测 尚 未 发 主事 件 的 个 
果 。 有 了 统计 学 这 个 特殊 朋友 玫 忙 ， 你 能 通过 观察 某 个 人 在 一 个 变量 上 的 表现 ， 来 
精确 估计 他 在 另 一 个 变量 上 的 得 分 。 








无 论 在 社会 科学 领域 还 是 其 他 领域 , 专家 们 往往 需要 预测 一 个 人 在 某 项 任务 上 的 表现 或 是 在 
某 个 变量 上 的 得 分 ， 却 无 法 直接 测量 这 些 关 键 变量 。 比 如 ,在 大 学 进行 录取 决策 时 ， 这 是 一 个 普 
遍 需 求 。 招 生 委 员 会 想 要 预测 学 生 入 学 后 的 表现 (平均 绩 点 或 毕业 时 的 总 绩 点 )， 但 是 ， 因 为 学 
生 并 没有 实际 和 学， 招生 委员 会 必须 利用 当前 掌握 的 信息 去 推测 未 来 。 

学 校 总 是 用 标准 化 的 高 考分 数 作为 佑 测 学 生 未 来 学 业 表现 的 一 个 指标 。 假 设 一 所 小 型 大 学 决 
定 使 用 美国 大 学 入 学 考试 (ACT ) 的 分 数 作为 学 生 第 一 年 期 末 平 均 绩 点 ( GPA ) 的 一 个 预测 指标 。 
招生 委员 会 回顾 了 几 百 个 大 一 学 生 的 GPA 以 及 他 们 的 ACT 分 数 。 让 他 们 高 兴 的 是 ,他 们 发 现 这 两 
个 变量 间 存 在 中 等 程度 相关 : 相关 系数 是 0.55。 

相关 系数 是 两 个 变量 间 线 性 相关 的 强度 度量 [Hack #11]， 相 关系 数 为 0.55 表 明 相 关 强 度 相当 
大 。 这 是 一 个 好 消息 ， 因 为 上 述 两 个 变量 间 相 关 的 存在 , 使 得 ACT 分 数 成 为 估计 GPA 分 数 的 一 个 
很 好 的 候选 指标 。 

简单 线性 回归 是 这 样 一 种 方法 , 它 可 以 生成 用 来 “ 豪 制 ”预测 未 来 魔法 方程 的 所 有 数值 。 这 
方法 生成 了 一 条 回归 线 ， 画 出 这 条 回归 线 ， 我 们 就 能 判断 未 来 情况 如 何 [Hack 大 2]。 不 过 ， 只 要 
有 了 这 个 方程 式 ， 我 们 就 不 再 需要 通过 实际 作 图 去 预测 。 












































2.3.1 烹饪 方程 式 


首先 ， 请 仔细 阅读 创造 公式 的 “食谱 ”( 参考 “回归 方程 食谱 ”)， 然 后 我 们 来 看 如 何 用 它 处 
理 真 实数 据 。 你 可 以 把 这 个 食谱 剪 下 来 放 到 厨房 抽 慑 里 。 
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回归 方程 食谱 
配料 
相关 变量 的 样本 数据 2 个 : 


。 效 标 变 量 ( 你 想 要 预测 的 变量 ) 1 个 
。 预 测 变 量 (用 作 预 测 指标 的 变量 ) 1 个 


两 变量 之 间 的 相关 系数 1 个 
样本 平均 值 2 个 
样本 标准 差 2 个 
容器 
空 方程 式 一 个 ， 形 式 如 下 : 
效 标 = 常量 +( 预 测 变量 x 权重 ) 
操作 方法 
计算 用 于 与 预测 变量 相 乘 的 权重 : 
权重 = 相关 系数 xX 效 标 标 准 差 /预测 标准 差 
计算 常量 : 
常量 = 效 标 平均 数 -( 权 重 x 预测 平均 数 ) 
把 刚才 算出 的 常量 和 权重 填 入 空 的 回归 方程 。 
适合 的 对 象 
每 个 对 估计 假设 结果 感 兴趣 的 人 











回归 方程 还 需要 另外 两 样 配料 , 即 两 个 变量 的 平均 数 和 标准 差 以 下 是 我 们 例子 中 的 统计 值 : 








2 平均 数 标准 差 
ACT 分 数 20.10 2.38 
GPA 2.98 0.68 


R.、 不 妨 回顾 “ 仅 用 两 个 数字 描述 世界 ”[Hack #2]， 复 习 平 均 数 和 标准 差 的 概念 。 

















招生 委员 会 通过 这 些 信息 建 立 了 一 个 回归 方程 。 结果 是 , 由 于 所 有 的 申请 函 都 寄 到 了 招生 委 
员 会 办 公 室 , 工作 人 员 能 够 把 学 生 的 ACT 分 数 输 入 回归 方程 并 预测 他 的 GPA 。 我 们 来 看 一 个 例子 ， 
计算 回归 方程 的 各 项 : 

















2.3 ”用 一 个 变量 预测 另 一 个 变量 ”43 





权重 = 相关 系数 x 效 标 标准 差 / 预 测 标准 差 


权重 =0.55 了 5 权重 =0.55(0.29) 权重 =0.16 


常量 = 效 标 平均 数 -( 权 重 x 预测 平均 数 ) 
2.98-(0.16 x 20.10)=2.98-3.22=-0.24 
我 们 把 所 有 信息 代入 回归 方程 ， 便 得 到 通过 ACT 分 数 预测 GPA 分 数 的 公式 
效 标 = 常 量 +( 预 测 变 量 x 权重 ) 


预测 GPA=-0.24+(ACT 分 数 x 0.16) 











注意 这 个 例子 中 常量 是 一 个 负 值 。 那 没有 关系 。 


2.3.2 ”预测 分 数 
还 是 那个 大 学 录取 的 例子 ,想象 招生 委员 会 接 到 两 份 申请 。 一 位 申请 者 名 叫 梅 利 莎 ，ACT 
分 数 是 26 分 。 另 一 位 申请 者 布鲁斯 的 ACT 分 数 是 14 分 。 
使 用 我 们 刚 建 立 的 回归 方程 运算 可 知 ， 这 两 人 最 终 的 平均 绩 点 会 有 两 个 不 同 的 结果 : 
@ 梅 利落 
口 预测 的 GPA=-0.24+(26 x 0.16) 
口 预测 的 GPA-0.24+4.16 
口 预测 的 GPA=3.90 
@ 布鲁斯 
口 预测 的 GPA=-0.24+(14 x 0.16) 
口 预测 的 GPA-0.24+2.24 
口 预测 的 GPA=2.00 
站 在 布鲁斯 的 立场 ， 我 希望 这 所 大 学 的 招生 和 名额 不 止 一 个 。 









































本 例 中 的 两 个 变量 ， 即 ACT 和 GPA 分 数 ， 有 着 不 同 的 度量 尺度 : ACT 分 数 通常 介 于 

A 1~36， 而 GPA 分 数 介 于 0~4.0。 相 关 分 析 的 一 个 奇妙 之 处 就 是 ,变量 的 度量 尺度 可 以 
不 同 ， 这 没有 关系 。 预 测 的 结果 不 知 怎 么 就 能 符合 效 标 变量 的 度量 尺度 。 听 起 来 有 
点 怪异 ， 是 吧 ? 
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2.3.3 ”生效 原理 


当 两 个 变量 彼此 相关 ,它们 提供 的 信息 有 重 秋之 处 , 就 如 同 二 者 共享 信息 一 样 。 统 计 学 家 有 
时 用 相关 信息 来 讨论 变量 共享 变异 。 

如 果 一 个 变量 的 变异 能 部 分 地 被 另 一 个 变量 的 变异 所 解释 , 那 就 可 以 理解 ， 聪明 的 数学 家 何 
以 能 用 一 个 相关 变量 去 估计 另 一 个 变量 上 平均 值 的 变异 ( 或 是 距 平均 值 的 距离 )。 他 们 可 能 需要 
用 一 些 数字 代表 变量 的 平均 值 和 变异 性 , 用 另 一 个 值 代表 信息 重 秋 度 。 我 们 的 回归 方程 包含 平均 
值 、 标 准 差 和 相关 系数 ， 这 样 就 使 用 了 上 述 所 有 信息 。 

















2.3.4 其 他 生效 领域 


回归 不 仅 用 在 预测 上 ,在 回答 研究 问题 上 也 非常 有 用 。 有 时 候 ， 科 学 家 只 想 了 解 一 个 变量 ， 
弄 清 它 的 作用 原理 或 在 总 体 中 是 如 何 分 布 的 。 他 们 可 以 通过 查看 该 变量 如 何 与 ( 他们 更 了 解 的 ) 
男 一 个 变量 发 生 关联 来 达到 目的 。 








” ”统计 学 家 口中 的 简单 线性 回归 之 所 以 被 称 为 “简单 ”( simple )， 不 是 因为 它 很 容易 
(easy )， 而 是 因为 它 只 用 到 一 个 预测 变量 。 这 种 简单 是 相对 于 复杂 而 言 的 。 现 实生 
活 中 ， 类 似 于 我 们 所 举例 子 的 预测 用 到 的 变量 总 是 不 止 一 个 ， 而 是 很 多 。 使 用 多 个 

预测 变量 来 预测 效 标 变量 的 方法 叫做 多 元 回归 [Hack #14]。 


2.3.5 不 适用 领域 


在 三 种 情况 下 预测 会 出 现 错误 。 第 一 ， 如 果 两 变量 间 的 相关 不 完美 ， 预 测 也 不 会 非常 准确 。 
鉴于 在 预测 变量 和 效 标 变量 之 间 几 乎 从 来 不 存在 真正 的 大 相关 ， 更 不 用 说 完美 的 1.0 相 关 ， 所 以 
现实 世界 里 回归 的 应 用 结果 错误 百出 。 尽管 如 此 , 只 有 存在 任何 相关 , 预测 就 比 盲目 猜测 更 准确 。 
你 可 以 通过 标准 误差 估计 [Hack #18] 来 算出 误差 的 大 小 。 

第 二 ,线性 回归 假定 关系 是 线性 的 。 这 在 “相关 图 表 ”[Hack #12] 里 详细 讨论 过 ,但 如 果 
相关 的 强度 在 分 数 分 布 区 间 的 不 同 点 上 存在 变化 ， 那 么 在 一 些 情况 下 回归 预测 会 产生 很 大 的 
误差 。 

第 三 , 如 果 最 初 收集 的 用 于 确定 回归 方程 中 各 个 值 的 数据 不 具备 对 未 来 数据 的 代表 性 , 那么 
预测 结果 就 会 出 错 。 比 如 , 在 大 学 录取 的 例子 中 ,如 果 一 个 申请 者 的 ACT 分 数 是 36 分 ,那么 预测 
的 GPA 值 将 为 5.52 分 。 这 是 一 个 不 可 能 的 值 ， 其 至 都 不 匹配 GPA 的 度量 尺度 ，GPA 最 大 值 为 4.0。 
因为 用 来 建立 预测 方程 所 用 的 过 往 数 据 极 少 或 根本 没 包 含 ACT 为 36 的 值 , 以 致 回归 方程 无 法 处 理 
如 此 之 高 的 分 数 。 
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岂可 2.4 用 多 个 变量 预测 单个 变量 

l 住 何 统 计 黑 客 者 可 掌握 预测 未 来 和 看 到 不 可 见 事 物 的 超 能 力 ， 只 要 他 们 觉得 这 种 能 
力 有 价值 。 统 计 党 家 总 是 用 一 个 灾 量 预测 另外 一 个 ， 以 此 来 田 答 问题 ， 并 用 相关 售 
息 未 解决 问题 。 但 为 了 更 准确 地 进行 预测 ， 可 以 使 用 多 元 回归 的 方法 ,将 不 同 的 预 
测 变量 钴 合 在 同一 个 回归 方程 里 。 


“相关 图 表 ”[Hack #12] 中 讨论 了 回归 线 在 预测 方面 的 有 用 性 。 利 用 这 些 方 法 , 行政 人 员 和 统 
计 研 究 人 员 能 够 预测 尚未 发 生 的 评估 表现 ,理解 变量 ,建立 关于 这 些 变 量 间 相关 性 的 理论 。 他 们 
只 用 一 个 预测 变量 就 能 完成 这 些 技巧 。 

“用 一 个 变量 预测 另外 一 个 变量 ”[Hack #13] 中 展示 了 大 学 招生 录取 时 直到 的 一 个 难题 : 他 们 
想 要 录取 未 来 学 业 出 色 的 学 生 , 所 以 他 们 尝试 预测 学 生 的 未 来 表现 。 这 条 Hack 所 采用 的 方法 是 用 
一 个 变量 (标准 测试 分 数 ) 去 估计 未 来 变量 的 表现 ( 大 学 成 绩 )。 

现实 世界 中 , 研究 人 员 经 常 想 要 利用 多 个 变量 中 所 发 现 的 信息 ( 而 不 仅仅 是 一 个 变量 ) 来 预 
测 或 估计 分 数 。 如 果 追 求 更 高 的 准确 度 , 科学 家 们 会 尝试 寻找 多 个 看 起 来 都 和 效 标 变量 ( 你 想 要 
预测 的 变量 ) 相关 的 变量 。 他 们 利用 所 有 这 些 信息 生成 一 个 多 元 回归 方程 。 








2.4.1 选择 预测 变量 





在 深入 探讨 本 条 Hack 前 ， 你 或 许 应 当 阅 读 或 者 重 温 “ 用 一 个 变量 预测 另外 一 个 变量 ”[Hack 
#13]， 只 是 为 了 回顾 一 下 手头 的 问题 以 及 回归 法 是 如 何 解决 该 问题 的 。 下 面 是 我 们 在 [Hack #13] 
中 建立 的 、 使 用 ACT 分 数 作为 单一 预测 变量 的 方程 式 ， 用 以 估计 未 来 大 学 录取 情况 : 

预测 的 GPA=-0.24+(ACT 分 数 x 0.16) 

这 个 单一 预测 变量 生成 了 一 个 回归 方程 , 结果 ACT 与 GPA 相 关 度 为 0.55。 非常 好 , 非常 准确 ， 
但 它 还 可 以 更 好 。 

想象 一 下 ， 假 设 该 大 学 的 管理 者 觉得 自己 刚 建立 的 回归 线 或 回归 方程 所 得 结果 还 不 够 准确 ， 
想 要 做 得 更 好 。 如 果 他 能 找到 更 多 的 和 大 学 成 绩 相 关 的 变量 ， 就 能 获得 一 个 更 准确 的 结果 。 不 妨 
假设 我 们 的 业余 统计 学 家 发 现 了 另外 两 个 和 大 学 表现 相关 的 预测 变量 ; 

口 态度 度量 
口 论文 质量 

态度 调研 分 数 可 能 是 由 大 学 收集 的 (分 值 范 围 为 20~100 分 )， 人 们 发 现 它 与 学 生 未 来 的 GPA 
具有 某 种 相关 。 此 外 ， 个 人 论文 得 分 (分 值 范 围 为 1~$ 分 ) 也 可 能 和 大 学 GPA 相 关 ， 或 许 能 够 包 
含 在 多 元 回归 方程 里 。 
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2.4.2 ”建立 多 元 回归 方程 
我 们 先 大 体 看 看 回归 方程 的 抽象 形式 ,然后 再 将 这 一 工具 应 用 于 手头 的 任务 。 以 下 是 仅 用 一 


个 预测 变量 的 基本 回归 方程 : 








效 标 变量 = 常量 +( 预 测 变量 x 权重 ) 
如 果 你 想 利用 更 多 的 信息 ,可 以 扩展 这 个 方程 ,使 其 包含 更 多 的 预测 变量 。 下 面 的 回归 方程 
包含 三 个 预测 变量 ， 但 你 还 能 扩展 该 方程 ， 将 更 多 的 变量 纳入 其 中 。 
效 标 变量 = 常量 + 
(预测 变量 1 x 权重 1) + 








"=). 








(预测 变量 2 x 权重 2) + 
(预测 变量 3 x 权重 3) 




















每 个 预测 变量 都 有 其 对 应 的 权重 , 其 大 小 是 通过 基于 预测 变量 和 效 标 变量 相关 的 统计 学 公式 
确定 的 。 具 体 计算 过 程 有 些 复杂 ， 在 此 就 不 予 展示 了 一 一 小 意思 ， 不 用 谢 我 。 在 现实 中 构建 回归 
方程 时 ， 人 们 几乎 总 是 用 计算 机 来 生成 多 元 回归 方程 。 
”本 书 中 的 许多 运算 都 是 运用 统计 软件 SPSS 完 成 的 : 我 把 数据 (通常 是 虚拟 的 ) 输入 
ww SPSS 数 据 文件 中 ， 从 而 得 出 结果 。 微 软 的 Excel 也 一 个 进行 简单 统计 分 析 的 便利 
开具 



































变量 之 间 也 存在 某 些 相关 ) 





使 用 我 们 能 找到 的 包含 三 个 与 效 标 变量 相关 的 预测 变量 ( 各 预测 2 
的 实际 数据 ， 我 们 可 以 生成 一 个 回归 方程 式 ， 其 值 如 下 : 
预测 GPA = 3.01+ 
(ACT 分 数 x 0.02) 二 
(态度 分 x 0.007)+ 
(论文 分 x 0.025) 
我 在 我 的 电脑 上 使 用 这 些 想象 的 数据 计算 出 上 述 权重 。 总 体 上 , 该 方程 可 以 很 好 地 预测 大 学 
GPA， 在 观测 的 GPA 分 值 和 预测 的 GPA 分 值 间 找 到 了 0.80 的 相关 ， 大 大 高 于 我 们 使 用 单一 预测 变 
量 产 生 的 0.55 相 关 。 











已 


_ 当 我 们 在 模型 〈 对 一 组 变量 以 及 变量 如 何 相关 的 描述 ) 中 加 入 另外 两 个 预测 变量 
即 态度 测量 和 论文 分 数 ， 0 这 是 因为 对 每 个 变量 都 用 部 
分 相关 替代 了 一 对 一 的 相关 。 此 外 ， 常 量 也 变 了 。2.4.2 节 会 对 此 加 以 讨论 。 
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2.4.3 ”作出 预测 并 理解 相关 


为 了 佑 计 某 个 学 生 未 来 在 大 学 期 间 的 学 业 表现 , 校方 管理 人 员 把 该 生 在 每 个 预测 变量 上 的 分 
数 输入 回归 方程 ,然后 将 每 个 变量 分 数 乘 以 其 对 应 的 权重 再 加 上 常量 , 所 得 的 值 就 是 对 该 生 未 来 
学 业 表 现 的 最 佳 估 计 。 当 然 ， 这 可 能 不 完全 正确 ( 实际 上 这 种 可 能 性 很 大 ), 但 总 比 没有 任何 信 
息 要 好 。 























ww 如 果 你 不 掌握 任何 信息 ， 只 能 凭空 估计 一 个 学 生 在 大 学 里 的 学 业 表 现 ， 你 应 该 估计 
他 的 分 数 相 当 于 平均 GPA 分 数 ， 不管 你 们 学 校 的 平均 分 是 多 少 。 











假如 你 不 仅 想 要 预测 未 来 , 还 想 透彻 理解 预测 变量 和 效 标 变量 之 间 的 关系 , 那 又 如 何 ? 你 的 
目的 可 能 是 想 建立 一 个 更 有 效 的 公式 , 其 中 无 须 包 含 众多 无 用 的 变量 ; 也 可 能 是 想 建立 一 种 用 于 











理解 这 个 世界 的 理论 一 一 你 这 个 疯狂 的 科学 家 ! 问题 在 于 , 你 很 难 做 到 仅 看 权重 就 知道 每 个 预测 
变量 的 独立 贡献 。 











在 多 元 回归 方程 里 , 每 个 变量 的 权重 是 和 每 个 变量 实际 的 分 数 区 间 范 围 成 比例 的 。 这 样 就 很 
难 通过 对 比 各 个 预测 变量 来 判断 哪个 在 预测 效 标 变 量 时 提供 的 信息 最 多 。 对 比 这 些 原 始 的 权重 可 
能 会 产生 误导 ， 因 为 一 个 变量 的 权重 较 小 ， 可 能 只 是 因为 它 的 度量 尺度 较 大 。 

例如 ， 我 们 来 对 比 ACT 分 数 的 权重 和 态度 分 数 的 权重 : ACT 分 数 的 权重 是 0.02 ， 比 态度 的 权 
重 0.007 要 大 , 但 不 要 误 以 为 ACT 分 数 在 预测 GPA 时 比 态 度 分 数 更 重要 。 记 住 , GPA 分 数 范围 是 1.0 
到 4.0 左 右 ， 而 态度 分 数 范围 是 20 分 到 100 分 。 与 较 大 的 ACT 分 数 权重 相 较 而 言 ， 较 小 的 态度 权重 
却 造 成 效 标 变量 产生 更 大 的 变动 。 

多 元 回归 分 析 的 计算 机 程序 结果 总 是 显示 为 表 2-4 那 样 格式 的 信息 。 



































表 2-4: 多 元 回归 结果 





效 标 非 标准 权重 标准 权重 
常量 3.01 下 

ACT 分 数 0.02 0.321 
态度 分 数 0.007 0.603 
论文 分 数 0.025 0.156 


在 确认 关键 预测 变量 和 对 比 每 个 预测 变量 在 估计 效 标 变 量 的 独特 贡献 时 ， 表 2-4 的 第 三 列 比 
“ 非 标准 权重 ” 列 的 值 更 有 用 。 
标准 权重 就 是 原始 数据 转换 成 Z 分 数 [Hack #26] 后 得 到 的 权重 ，Z 分 数 是 用 标准 差 来 
示 每 个 原始 数据 和 平均 数 的 距离 。 
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标准 权重 将 所 有 预测 变量 纳入 了 同样 的 度量 尺度 。 这样 一 来 ,可 以 公平 地 对 各 个 预测 变量 对 
效 标 变 量 的 相对 重 炙 部 分 加 以 对 比 和 理解 。 比 如 ,运用 这 些 数据 , 或 许可 以 适当 地 说 ,态度 对 大 
学 GPA 的 解释 量 是 ACT 表 现 解 释 量 的 两 倍 ， 因 为 态度 的 标准 权重 是 0.603， 大 约 是 ACT 分 数 权重 
(0.321 ) 的 两 倍 。 























2.4.4 生效 原理 


多 元 线性 回归 在 预测 结果 时 表现 得 比 简单 线性 回归 要 好 , 是 因为 多 元 回归 使 用 了 一 点 额外 的 
信息 , 来 计算 每 个 预测 变量 的 实际 权重 。 多 元 回归 知道 每 个 变量 和 其 他 变量 之 间 的 相关 ,并 用 这 
种 相关 去 生成 更 准确 的 权重 。 

这 点 复杂 性 是 有 必要 的 ， 因 为 如 果 预 测 变量 之 间 存 在 相关 ,它们 就 会 共享 一 些 信息 。 如 果 它 
们 互相 相关 , 那 它们 就 不 是 真正 的 独立 预测 源 。 为 了 使 得 回归 方程 尽 可 能 准确 ,统计 学 方法 移 除 
了 方程 中 每 个 变量 互相 共享 的 信息 。 这 样 就 产生 了 从 不 同 角度 对 效 标 的 独立 预测 变量 , 生成 了 尽 
可 能 准确 的 预测 。 
































x 想象 两 个 预测 变量 ， 二 者 间 呈 完美 相关 ， 相 关系 数 是 1.00。 在 同一 个 回归 方程 里 使 用 
这 两 个 变量 ， 并 不 会 比 只 用 一 个 【不 管 是 哪个 ) 要 准确 。 引 申 可 知 ， 两 个 预测 变量 
间 的 任何 重 登 (比如 ， 两 个 预测 变量 间 任 何 大 于 或 小 于 0.00 的 相关 ) 都 是 宛 余 信息 。 





图 2-3 说 明了 使 用 多 个 独立 信息 来 源 去 估计 一 个 效 标 分 数 的 情形 。 























图 2-3: 多 元 回归 中 的 多 个 预测 变量 

在 多 元 回归 中 , 用 来 决定 每 个 预测 变量 权重 的 相关 信息 , 不 是 预测 变量 和 效 标 变量 的 一 对 一 
相关 ， 而 是 当 所 有 预测 变量 之 间 的 重 鳃 被 移 除 后 ， 预 测 变 量 和 效 标 变量 之 间 的 相关 。 

这 个 过 程 产生 了 有 点 不 同 于 实际 测量 变量 的 预测 变量 。 通 过 统计 学 上 的 移 除 (或 是 控制 ) 变 
量 间 的 共享 信息 ,预测 变量 在 概念 上 变 得 不 同 于 以 往 。 正如 图 2-3 所 示 , 现在 它们 是 有 着 不 同 “ 形 
状 ” 的 独立 变量 。 这 些 改变 后 的 变量 和 效 标 变量 的 相关 被 用 来 生成 权重 。 









































2.5 ”识别 非 预期 结果 49 





x 当 所 有 兄 余 信 息 从 预测 变量 上 被 统计 移 除 后 , 预测 变量 和 效 标 变量 之 间 的 相关 被 称 
作 部 分 相关 。 部 分 相关 是 在 预测 变量 和 其 他 变量 不 相关 的 情况 下 ,每 个 预测 变量 和 
效 标 变量 之 间 一 对 一 的 相关 。 


2.4.5 ”其 他 生效 领域 


在 现实 世界 中 ， 多 元 回归 每 天 实 实在 在 地 被 人 们 使 用 着 , 其 原因 有 二 。 首 先 ， 多 元 回归 使 得 
预测 方程 的 构建 成 为 可 能 , 所 以 人 们 能 够 用 已 有 的 群 组 分 数 去 估计 另 一 个 不 在 眼前 的 变量 的 分 数 
(因为 它 尚未 发 生 或 是 由 于 某 些 原因 无 法 轻易 测量 ), 这 就 是 多 元 回归 这 种 统计 工具 在 应 用 科学 领 
域 解决 问题 的 原理 。 

多 元 回归 同样 能 检验 一 组 变量 对 其 他 变量 的 独立 贡献 。 它 让 我 们 看 到 哪里 有 变量 间 的 信息 重 
县 , 并 建立 理论 去 理解 或 解释 这 种 重 仅 。 这 是 多 元 回归 这 种 统计 工具 在 基础 科学 领域 解决 问题 的 
原理 。 








1 2.5 识别 非 预期 结果 
遂 风 】 你 怎么 知 送 你 的 观测 值 是 否 正确 ， 喜 着 是 否 存 在 篇 差 ? 你 怎么 知道 什么 时 修 某 件 事 
发 生 的 概 这 可 能 比 原本 应 该 发 生 的 概 认 大吉 小 ? 你 可 以 先 笠 只 沪 的 单 因 素 方 差 检 验 
来 确切 地 获知 以 上 问题 的 答 委 。 
在 科学 领域 ， 最 古老 的 观测 研究 包括 清点 人 员 、 动 物 和 物件 的 数目 。 
口 这 条 船上 有 多 少 人 ? 
D 怒 膀 上 带 绿 点 的 师 蝶 比例 是 多 少 ? 
随 着 推断 统计 走向 成 熟 ， 问 题 变 得 更 加 具体 。 
D 1812 年 伦敦 出 生 的 男孩 和 女孩 数量 相同 吗 ? 
口 一 天 中 不 同时 段 发 生 的 罪案 数量 相同 吗 ? 
这 些 情境 中 的 研究 问题 是 “他 们 /它们 的 数量 相同 吗 "。( 或 者 至 少 是 ， 他 们 /它们 的 数量 是 否 
足够 接近 以 至 于 任何 波动 绽 可 能 出 于 偶然 ) 不 等 同 分 布 的 意思 就 是 有 事情 在 发 生 。 它 无 法 回答 
实际 在 发 生 什么 的 问题 。 但 这 是 一 个 开端 ， 一 个 很 好 的 初始 问题 。 


你 是 否 注 意 到 某 种 和 异常 情况 似乎 正在 发 生 , 但 不 确定 那 是 否 只 是 你 的 想象 ? 在 本 地 社区 商场 
购物 的 嬉 皮 土 是 否 异常 增多 , 超出 了 偶然 几率 ”如 果 答 案 是 肯定 的 ， 而 且 你 很 想 遇见 嬉 皮 士 , 那 
你 就 该 在 商场 附近 多 转 转 。 


对 于 商家 和 服务 业 人 士 来 说 , 确认 哪里 有 最 大 的 需求 非常 重要 。 观测 数据 能 够 用 来 解决 这 个 
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问题 。 甚 至 只 在 日 常生 活 中 ,我 们 都 有 自己 的 基于 观察 的 信念 (有 可 能 有 偏差 )。 我 已 经 注意 到 
社区 商店 里 有 很 多 嬉 皮 士 , 但 这 或 许 是 因为 我 当时 特别 留意 了 嬉 皮 士 。 那个 地 方 的 嬉 皮 士 确实 比 
平常 多 吗 ? 比 普通 人 更 多 ? 
这 类 问题 可 以 借助 一 种 统计 方法 来 回答 , 这 种 方法 适用 于 查看 多 个 类 别 中 的 每 一 类 所 包含 的 
“事物 ”数量 较 之 正常 状态 下 随机 发 现 的 数量 是 否 有 所 不 同 。 这 方法 叫做 单 因素 卡 方 检验 。 
这 种 统计 分 析 之 所 以 称 作 “ 卡 方 检验 ”, 是 因为 它 用 符号 C( 即 希腊 字母 X, 读 作 /kai/ ) 
来 表示 生成 的 临界 值 。 计算 中 所 需 的 值 都 是 平方 值 ， 所 以 我 们 将 其 统称 为 卡 方 ( 英 
文 为 chi-square 或 chi-squared )。 


2.5.1 判断 是 否 有 异常 情况 

假设 你 负责 制定 你 所 在 城镇 的 警察 巡逻 时 间 表 。 问 题 在 于 ， 你 不 知道 是 否 该 对 每 一 班 安排 
相同 数量 的 警 员 , 或 许 特定 班次 需要 应 对 的 罪案 数量 更 多 ? 如 有 果 某 个 班次 可 能 会 忙 些 , 那 你 应 该 
在 这 个 时 段 分 配 更 多 的 警 员 。 当 然 ， 在 该 时 段 分 配 更 多 和 警 员 ， 加 强 巡 视 ， 也 能 起 到 抑制 犯罪 的 
效果 。 

下 面 的 例子 以 虚构 的 数据 表现 了 三 个 时 段 内 犯罪 事件 发 生 的 情况 。 假 设 这 些 数 据 取 自 30 天 的 时 
间 ， 你 想 要 利用 它们 为 来 年 做 计划 。 表 内 数字 代表 三 个 时 段 中 每 一 时 段 发 生 的 犯罪 数量 。 


























午夜 12 点 至 早晨 8 点 早晨 8 点 至 下 午 4 点 下 午 4 点 至 午夜 12 点 总 计 
120 90 90 300 





无 疑 , 看 起 来 更 多 的 犯罪 发 生 在 深夜 。 仅 通过 观察 ,我 们 就 可 能 得 出 结论 说 ,深夜 里 的 罪案 
更 多 。 但 是 ， 那 也 许 仅 在 我 们 的 样本 中 如 此 ， 而 在 总 体 数 据 中 并 不 存在 这 样 的 差异 。 


2.5.2 ”计算 卡 方 


我 们 能 计算 这 个 数据 的 卡 方 值 。 如 果 卡 方 值 的 确 很 大 ， 那 就 说 明 深夜 时 段 的 罪案 数量 ( 120 
次 ) 异乎 寻常 地 大 于 男 外 两 个 时 有 段 的 罪案 数量 。 多 大 才 算 “的 确 很 大 ”， 这 是 个 很 重要 的 问题 ， 
我 们 将 在 本 节 稍 后 部 分 加 以 讨论 。 
可 以 按 以 下 脉络 来 理解 我 们 即将 做 的 分 析 : 如 果 24 小 时 内 总 共 发 生 了 300 次 犯罪 ， 
鼎 那么 我 们 可 以 预期 一 天 内 三 个 相等 时 间 段 内 各 有 33.3% 的 犯罪 ， 也 就 是 说 每 个 时 段 
有 100 次 犯罪 发 生 。 如 果 任 意 一 个 时 段 内 的 罪案 数量 超过 或 少 于 100 次 ， 就 意味 着 有 
异常 情况 。 也 许 时 间 段 对 犯罪 的 发 生 有 影响 。 当 然 ， 也 可 能 有 些 偶然 的 波动 ， 但 期 
望 频次 和 实际 频次 的 差异 越 大 ， 这 种 差异 仅仅 是 出 于 偶然 的 可 能 性 就 越 小 。 
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以 下 是 卡 方 计算 公式 : 











下 _A (观测 频次 -期 望 频次 ) 
期 望 频次 























3 表示 求 和 或 是 把 它 后 面 的 各 项 相 加 。 


让 我 们 计算 这 个 数据 的 卡 方 。 每 个 类 别 的 观测 频次 是 给 定 的 。 每 个 单元 的 期 望 频次 是 300 除 
以 类 别 数量 3 ， 即 100: 




















(120-100) ， (90-100) (90-100) 
100 100 100 





2 2 这 2 2 
(20) 10) ,10) _400 ,100 100_ 1 ,1 416 
100 100 100 100 100 100 


这 个 数据 的 卡 方 值 是 6。 很 好 。 现 在 该 做 什么 ”6 是 大 是 小 还 是 其 他 ? 卡 方 值 大 小 为 6 是 偶然 
的 吗 ? 






































2.5.3 判断 卡 方 值 是 否 “的 确 大 ” 


就 像 相 关系 数 [Hack #11]、t 检 验 [Hack #7]、 比 例 等 其 他 一 切 统计 方法 一 样 ， 统 计 学 家 已 经 

标定 了 卡 方 的 分 布 。 换 句 话说 , 我 们 知道 不 同 大 小 的 卡 方 偶然 出 现 的 可 能 性 。 发 现 特 别 巨 大 的 卡 
方 值 的 可 能 性 ， 取 决 于 类 别 的 数量 。 
表 2-5 为 一 张 理论 上 超级 庞大 的 表格 的 一 部 分 ， 表示 为 了 有 95% 把 握 ( 显著 水 平 =0.05 ) 必须 
达到 的 卡 方 值 。 如 果 卡 方 值 没 那么 大 , 说 明 只 是 样本 中 的 偶然 波动 导致 的 。 我 们 知道 这 些 临 界 值 
有 5% 或 更 小 的 几率 出 现 ， 因 为 卡 方 值 就 像 有 序 的 统计 世界 中 几乎 所 有 其 他 事物 一 样 ， 有 着 一 个 
已 知 的 分 布 ， 即 一 个 特定 值 出 现 可 能 性 的 已 知 集合 。 像 正 态 曲线 一 样 ， 卡 方 分 布 也 具有 明确 的 定 
义 [Hack #23]。 








表 2-5: 显著 性 为 0.05 的 卡 方 临界 值 
两 个 类 别 三 个 类 别 四 个 类 别 五 个 类 别 
3.84 5.99 7.82 9.49 

我 们 的 卡 方 值 是 6， 大 于 三 个 类 别 对 应 的 临界 值 ( 5.99 )。 这 意味 着 存在 某 些 异常 的 情况 ， 所 
以 我 会 强调 它 。 虽然 这 里 是 以 犯罪 发 生 率 问题 作为 一 个 具体 事例 , 但 我 使 用 的 描述 方式 通用 于 所 
有 在 0.05 显 著 水 平 的 统计 发 现 。 





























52 第 2 章 发 现 相 关 ' 性 (Hack #11~#22 ) 





刀 如 果 在 总 体 中 ,一 天 中 三 个 时 段 的 犯罪 数量 并 无 差异 ， 你 也 可 能 随机 抽取 到 有 差异 
的 样本 ， 产 生 的 卡 方 值 为 6 或 更 大 ， 但 这 种 情形 发 生 的 概率 低 于 $%。 


那 


些 差异 





么 ,看 来 我 们 可 以 合理 地 得 出 结论 ， 总体 中 一 天 内 不 同时 段 的 犯罪 频次 存在 差异 。 因 为 这 
是 “真实 的 ”>， 所 以 有 理由 在 此 基础 上 安排 全 年 的 警察 巡逻 计划 。 





2.5.4 生效 原理 


卡 方 分 析 的 数据 表示 方式 能 使 每 类 事物 的 观测 数量 和 每 类 事物 的 期 望 数量 相 比 较 。“ 每 类 事 
物 的 期 望 数量 ”总 是 被 定义 为 一 个 相等 的 数 。 如 果 没 有 异常 情况 比如 ， 类 别 之 间 没 有 差异 )， 
那么 可 以 预期 各 个 类 别 中 事物 的 数量 相等 。 

卡 方 适用 于 类 别 数据 。 实 质 上 , 每 个 类 别 的 期 望 值 和 观测 值 之 间 的 差异 都 会 被 计算 。 将 差异 
和 期 望 频次 加 以 对 比 ( 作为 一 种 标准 化 所 有 差异 的 方法 )， 然 后 把 所 有 的 比例 数字 相 加 。 相 加 得 
到 的 结果 是 它 偶然 出 现 的 可 能 性 。 数 字 越 大 ,用 偶然 性 单独 解释 事情 的 可 能 性 越 低 。 存 在 一 个 已 
知 的 分 布 ( 每 个 可 能 卡 方 值 对 应 的 概率 ), 通过 表格 ( 或 计算 机 ) 将 特定 的 概率 派 给 每 个 卡 方 值 。 

如 果 类 别 数 大 于 或 等 于 2， 研 究 人 员 又 想 知道 这 些 类 别 中 的 实际 分 布 情况 是 否 与 偶然 出 现 的 
相同 ,那么 卡 方 就 是 一 个 合适 的 检验 方法 。 实 际 检 出 值 是 研究 者 预期 发 现 和 实际 发 生 之 间 的 差异 。 

卡 方 检验 的 使 用 框架 是 : 研究 者 怀 有 某 种 预期 , 以 此 方法 来 检验 观测 数据 是 否 与 该 预期 相符 。 
这 是 一 个 简单 的 模型 检验 形式 。 人 研究 者 有 一 个 信念 系统 ， 以 某 些 模型 或 假说 ( 认为 现实 世界 的 运 
转 方式 应 当 如 何 ) 的 形式 存在 。 随 后 他 就 观察 世界 〈 收集 数据 ) 并 将 他 的 观测 结果 和 模型 加 以 对 
比 。 如 果 数 据 符合 模型 ， 便 对 假设 形成 支持 。 因 此 ， 卡 方 检验 被 视 为 一 种 拟 合 优 度 统计 检验 法 。 
它 回答 的 是 数据 在 多 大 程度 上 与 模型 相符 的 问题 。 







































































有 些 统计 教科 书 把 单 因 素 卡 方 检验 称 作 单 样本 卡 方 检验 ， 所 以 不 要 把 它们 摘 混 了 。 
但 是 ， 难 道 你 还 有 必要 去 读 别 的 统计 书 吗 ? 








统计 学 家 了 解 观 测 频 次 较 之 期 望 频次 可 能 出 现 的 常态 波动 的 大 小 。 掌握 了 这 个 信息 , 他 们 就 
能 计算 观测 值 与 预期 值 之 间 出 现任 何 偏离 的 可 能 性 究竟 是 出 于 偶然 还 是 缘 自 其 他 因素 的 影响 。 


2.5.5 ”其 他 生效 领域 


卡 方 检验 作为 一 种 统计 学 方法 虽然 简单 而 古老 〈 大 约 80 年 历史 一 一 在 统计 学 领域 已 经 算是 
“古老 ”了 ), 但 它 对 于 很 多 统计 问题 的 解决 都 非常 有 用 ， 从 测量 标准 较 低 的 到 非常 高 级 的 统计 方 
法 都 是 如 此 ,惊讶 吧 ! 因为 它 是 一 种 相当 直接 的 模型 检验 〈 或 “ 拟 合 优 度 检验 ”) 方法 ， 所 以 卡 
方 检验 被 用 作 复 杂 的 相关 分 析 以 及 测量 诊断 的 一 部 分 。 
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卡 方 分 析 用 来 检验 复杂 的 理论 模型 是 否 真 的 与 现实 世界 的 数据 相符 , 这 些 理论 模型 是 变量 间 
相关 性 的 详细 说 明 。 如 采 现 实数 据 距 这 些 模型 的 预期 偏离 太 多 ,那么 我 们 可 以 下 结论 说 模型 为 弱 。 
卡 方 显 著 性 是 显示 “过 多 ”偏离 的 判 据 。 

比如 ， 测 试 研发 人 员 若 关注 测 项 偏差 一 一 某 一 测 项 对 于 一 个 可 识别 群 组 ( 如 种 族 、 性 别 等 ) 
的 作用 可 能 不 同 于 对 另 一 群 组 的 作用 , 他 们 会 检查 答案 选项 的 模式 是 否 符合 某 种 预期 , 而 不 考虑 
是 哪 组 产生 的 数据 。 卡 方 检验 分 析 是 对 预期 和 实际 测试 表现 加 以 对 比 。 

















2.5.6 ”参阅 
“识别 非 预期 相关 ”[Hack #16]。 


J 2.6 识别 非 预期 相关 
1 唤 如 果 你 想 弄 清 自 己 观 测 到 的 两 变量 之 间 的 相关 是 否 为 真 ， 有 很 多 贷 计 方法 可 以 选用 。 
但 是 当 你 对 这 些 变 量 使 用 类 别 测 量 法 进行 准确 性 不 大 高 的 测量 时 ， 就 会 出 现 一 个 问 
题 。 共 解 天 办 法 是 采用 两 因素 卡 方 检验 ,这 种 方法 除了 其 他 一 些 用 处 以 外 ,还 可 用 来 
对 初 识 者 的 特征 做 暂 无 事实 根据 的 假设 。 





在 “识别 非 预 期 结果 ”[Hack 如 5] 中 ， 我 们 采用 了 单 因 素 卡 方 检验 ， 依 据 一 天 中 不 同时 段 犯 
罪 数 是 否 相同 而 制定 警察 巡逻 班次 。 这 种 方法 对 于 解决 如 下 情况 的 分 析 问 题 大 有 效力 。 
D 数据 属于 分 类 测量 的 范畴 ( 如 性 别 、 党 派 、 种 族 等 )。 
D 你 想 要 判断 某 些 特定 类 别 中 分 数 的 频次 是 否 高 于 其 随机 出 现 的 频次 。 

当 你 对 两 类 变量 是 否 互相 关联 感到 好 奇 时 ,你 会 遇 到 另外 一 个 常见 的 分 析 性 问题 。 类 别 变量 
间 的 相关 能 够 用 方便 的 两 因素 卡 方 检验 来 考察 。 























如 果 两 个 变量 属于 区 间 测 量 的 范畴 ( 在 一 个 连续 体 上 可 能 存在 多 个 分 数 )， 相 关系 
数 [Hack#11] 是 最 好 的 工具 ， 但 这 种 工具 在 类 别 测 量 方面 表现 并 不 出 色 。 


我 们 一 直 在 对 以 上 类 型 的 变量 间 相 关 做 出 假设 。 我 们 给 人 划分 类 型 的 很 多 常见 刻板 印象 其 
实 就 是 无 形 中 对 这 些 关 系 做 出 假设 。 下 面 这 些 你 可 能 抱 有 的 假设 ， 就 隐 含 着 类 别 变量 之 间 的 相 
关 性 。 

口 教授 们 总 是 心 不 在 需 的 。 

口 程序 员 玩 《 龙 与 地 下 城 》( Dungeons and Dragons ) 游戏 。 
口 本 书 作者 是 喜欢 收集 漫画 的 成 年 人 。 

口 教授 们 总 是 心 不 在 青 的 。 
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如 果 你 在 聚会 上 碰 到 一 名 程序 员 , 并 且 对 程序 员 群 体 持 有 上 述 刻 板 印 象 , 你 可 能 会 假定 他 熟 
悉 20 面 仍 子 游戏 。 但 是 ,如果 你 错 了 ， 就 会 使 双方 的 交谈 陷入 黎 众 。 所 以 最 好 还 是 先 了 解 你 所 着 
眼 的 类 别 变量 之 间 是 否 真 的 存在 上 述 相关 。 计 算 两 因素 卡 方 能 解决 这 个 问题 , 并 且 能 够 证 实 或 质 
疑 这 些 关 于 人 的 假设 。 












































单 因素 卡 方 回顾 
卡 方 检验 是 在 如 下 框架 下 使 用 的 : 研究 者 事先 抱 有 茶 种 预期 ， 想 看 看 观测 数据 是 否 与 这 种 
预期 相符 .统计 学 家 了 解 观测 频次 较 之 期 望 频次 可 能 出 现 的 常态 波动 的 大 小 .掌握 了 这 个 信息 ， 
他 们 就 能 判断 观测 值 与 预期 值 之 间 出 现任 何 偏离 的 可 能 性 究竟 是 出 于 偶然 ,还 是 缘 自 其 他 因素 
的 影响 ，。 这 些 分 析 的 原始 数据 总 是 菜 个 变量 类 别 中 的 人 数 ( 或 者 频次 ) 
以 下 是 计算 卡 方 的 通用 公式 : 
(观测 频次 -期 望 频 次 ) 
期 望 频次 
马 表 示 对 它 后 面 的 数 求 和 。 卡 方 值 越 大 ， 结 果 随 机 出 现 的 可 能 性 就 越 小 。 


卡 方 = 六 











2.6.1 回答 相关 性 问题 

单 因素 卡 方 分 析 的 是 单一 类 别 变量 , 而 两 因素 卡 方 分 析 的 是 两 个 类 别 变量 之 间 的 相关 。 二 者 
的 内 在 原理 是 一 样 的 : 将 每 一 类 或 组 合 类 的 期 望 频次 与 实际 频次 加 以 对 比 。 如 果 差 异 之 和 达到 了 
一 个 很 大 的 数 ， 那 么 就 有 其 他 因素 作用 的 影响 。 

这 儿 有 一 个 我 们 可 能 很 想 找到 答案 的 类 别 相 关 问 题 。 它 和 其 他 有 待 探 究 的 刻板 印象 问题 大 同 
小 异 。 

女性 更 倾向 于 加 入 民主 党 还 是 共和 党 ? 

你 心里 可 能 对 此 已 经 抱 有 某 种 假定 ， 但 你 要 如 何 去 检 验 这 样 一 个 假定 的 准确 性 呢 ? 

1. 执行 预备 分 析 

首先 来 看 表 2-6 的 例子 ， 其 中 显示 了 一 组 单一 分 类 变量 的 频次 数据 。 这 些 数据 是 虚构 的 ,但 
和 公开 发 表 的 研究 结果 一 臻 ， 通 常 发 现 共和 党 人 十 大 多 是 男性 ， 而 女性 倾向 于 认同 民主 党 。 









































表 2-6: 共和 党 假设 样本 
男性 女性 
45 30 


在 这 个 75 个 随机 抽取 的 共和 党 人 样本 中 ，45 名 是 男性 ，30 名 是 女性 。 即 60% 为 男性 ，40% 为 
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女性 。 我 们 能 否 这 么 下 结论 , 认为 共和 党 的 成 员 通 常 是 男性 多 于 女性 ?否则 的 话 , 我 们 就 会 预期 
样本 中 男女 各 占 50%。 


单 因 素 卡 方 检验 能 知道 共和 党 员 中 男性 是 否 多 于 女性 ， 但 那 不 是 本 条 Hack 要 探讨 的 
问题 。 





然而 这 不 是 我 们 的 研究 问题 。 

2. 计算 两 因素 卡 方 

我 们 开头 的 问题 只 包括 了 共和 党 ， 所 以 在 第 一 次 分 析 中 ， 党 派 看 起 来 像 是 一 个 变量 ， 但 它 
其 实 只 是 对 总 体 的 一 个 描述 ; 它 没 发 生 任何 变化 。 但 是 我 们 可 以 添加 另 一 个 类 别 一 一 比如 说 民主 
党 一 一 再 招募 75 个 被 坛 ， 这 样 我 们 马上 就 有 了 两 个 变量 的 数据 。 假 设 这 些 数据 如 表 2-7 所 示 。 





表 2-7: 选民 的 假设 样本 











党 派 男性 女性 总 计 
共和 党 45 30 75 
民主 党 34 41 75 
总 计 79 71 150 





这 里 我 们 有 两 个 分 类 变量 : 所 属 党 派 和 性 别 。 我 们 可 以 继续 使 用 单 因 素 分 析 ，, 分 别 分 析 这 两 
行 数据 。 但 是 ， 一 个 更 有 代表 性 的 问题 或 许 是 :“ 党 派 和 性 别 之 间 存 在 相关 吗 ? ” 








答 : 这 让 我 想起 了 大 一 的 时 候 。 
( 哈 ! 这 种 笑话 我 这 儿 多 的 是 ! 本 周 内 我 都 会 在 这 儿 。 大 家 晚安 ! ，) 


en 





为 了 计算 期 望 频次 和 观测 频次 之 间 差 异性 的 标准 测量 , 我 们 使 用 和 单 因素 卡 方 分 析 一 样 的 公 
式 。 正 如 “识别 非 预期 结果 ”[Hack #5] 中 所 示 ， 我 们 首先 要 加 总 每 个 单元 格 ( 表 上 的 每 一 格 ) 
内 的 预期 和 观测 频次 之 差 。 


我 们 对 两 因素 卡 方 做 同样 的 运算 。 每 个 单元 格 的 期 望 频次 等 于 单元 格 所 在 行 的 人 数 乘 以 单元 
格 所 在 列 的 人 数 ， 然 后 除 以 样本 总 数 。 使 用 表 2-7 的 数据 ， 对 期 望 频次 的 计算 展示 在 表 2-8 里 。 


























注 1: 20 世 纪 美 国 著名 谐 星 杰 米 ， 杜 兰 特 (Jimmy Durante ) 的 一 名 口头禅。 一 一 译 者 注 
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表 2-8: 两 因素 卡 方 分 析 期 望 频次 





党 派 男性 女性 
共和 和 党 (75x79) /150=39.5 (75 x 71)/150=35.5 
民主 党 (75x79 ) /150=39.5 (75 x 71)/150=35.5 








所 以 ,两 因素 卡 方 的 计算 如 下 所 示 : 
(45-39.5) ; (34—39.5) ; (30-35.5) (41-35.5) 
39.5 39.5 35.5 35.5 


(5.5) (=5.5) (=5.5) (5.5) 
39.5 395 35.5 ~ 35.5 


卡 方 





卡 方 = 





30.25 (30.25) (30.25) (30.25) 


卡 方 + + + 
39.5 39.5 35:5 35.5 








卡 方 =0.77+0.77+0.85+0.85 = 3.24 

3. 判断 卡 方 值 是 否 足够 大 

统计 学 家 知道 2 x 2 表格 ( 就 像 我 们 刚才 计算 的 卡 方 一 样 ) 的 卡 方 临界 值 是 3.84。 在 随机 情况 
下 ， 卡 方 值 大 于 3.84 的 几率 大 约 为 5% 或 更 少 [Hack #15]。 
因为 我 们 的 卡 方 值 是 3.24， 小 于 临界 值 3.84， 于 是 我 们 知道 这 样 一 个 波动 随机 发 生 的 概率 高 
于 5%。 这 里 我 们 还 不 能 宣称 达到 统计 显著 性 ， 因 此 我 们 必须 下 结论 说 ,虽然 我 们 的 样本 似乎 显 
示 所 属 党 派 和 性 别 这 两 个 类 别 变量 之 间 存 在 某 种 相关 , 但 这 可 能 是 因为 取样 误差 所 致 。 在 我 们 抽 
样 的 总 体 中 ， 可 能 不 存在 任何 相关 。 

















2.6.2 ”生效 原理 


两 因素 卡 方 通过 观察 差异 性 来 回答 此 类 相关 性 问题 。 这 可 能 看 起 来 有 违 直觉 ,因为 大 多 数 统 
计 是 通过 寻找 不 同 来 展示 差异 ， 而 不 是 展示 相似 性 。 但 其 中 的 思维 多 辑 是 ， 

D 如 果 党 派 和 性 别 之 间 不 存在 相关 ， 那 么 每 个 性 别 群 组 中 共和 党 人 和 民主 党 人 应 当 各 占 
一 半 ; 

口 同样 ， 如 果 党 派 和 性 别 之 间 不 存在 相关 ， 那 么 每 个 党 派 内 部 的 男女 成 员 也 应 当 各 占 一 半 ; 
吕 这 种 双向 的 等 同 分 布 应 为 随机 形成 。 相 对 于 上 述 预期 的 较 大 偏离 表明 有 外 界 因素 作用 的 











忆 / 
宗 乡 啊 o 


本 项 Hack 可 用 于 检验 我 们 持 有 的 刻板 印象 是 否 正确 。 当 然 , 在 超 乎 现实 世界 的 科学 领域 , 研 
究 人 员 还 使 用 这 个 方法 去 探索 形形色色 的 复杂 问题 。 
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两 因素 卡 方 分 析 有 时 候 称 作 列 联 表 分 析 , 当 你 手 上 有 两 个 类 别 变量 并 且 想 知道 一 个 变量 对 另 
个 变量 是 否 有 某 种 依赖 时 候 , 这 种 方法 非常 有 用 。 本 例 中 的 变量 只 有 两 个 类 别 , 但 我 们 可 以 以 
此 类 推 ， 对 多 个 类 别 的 变量 进行 分 析 。 它 的 技术 要 求 会 有 点 复杂 ， 但 步骤 是 一 样 的 。 








2.6.3 ”参阅 


“识别 非 预期 结果 ”[Hack #15] 


Ca 2.7 比较 两 组 
#17 哪个 更 好 ? 哪个 更 多 ? 人 与 人 之 间 真 的 有 差异 吗 ? 诸如 此 类 的 定量 问题 是 我 们 礼节 
性 谈话 内 容 当 中 的 重 兴 戎 。 如 果 你 想 要 拿 出 真实 的 证 据 来 支持 自己 关于 哪个 最 好 、 哪 
个 最 多 、 哪 个 最 少 约 观点 ， 可 以 使 用 一 种 叫做 “t 检 验 ” 的 统计 工具 来 达到 目的 。 





我 叔叔 弗 兰 元 的 脑子 里 总 是 充满 这 样 那样 的 观点 。 比 如 ， 他 认为 绿色 的 M&M 巧克力 豆 比 蓝 
色 的 味道 好 ， 他 认为 女性 从 来 不 会 收 到 超速 罚单 ， 他 认为 《 脱 线 家 族 》( Brady Bunch ) 中 的 孩子 
们 唱 得 比 《 贴 鸥 家 庭 》( Partridge Family ) 中 的 更 好 听 。 还 有 ， 他 认为 格子 花呢 又 回归 潮流 了 。 
他 一 天 到 晚 接二连三 地 抛 出 那些 不 成 熟 的 观点 。 虽 然 在 上 述 四 个 问题 上 我 都 持 不 同意 见 ( 尤其 是 
说 到 格子 花呢 回归 潮流 这 一 点 ， 因 为 它 从 来 都 没有 退出 时 尚 )， 但 我 只 能 直接 说 明 我 的 观点 来 反 
驳 他 ， 除 此 之 外 拿 不 出 别 的 证 据 。 

要 是 有 某 种 科学 的 方式 来 证 明 我 板 板 弗 兰 克 是 对 还 是 错 , 那 该 有 多 好 ! 你 无 疑 能 够 看 出 
我 这 人 句 话 是 在 玩弄 修辞 手法 。 事实 上 , 可 用 来 检验 此 类 假设 的 统计 方法 多 得 不 可 胜 数 。 其 中 一 个 
最 简单 的 工具 , 其 设计 目的 就 是 为 了 检验 最 简单 的 声明 。 如 果 你 想 判断 两 个 组 别 之 间 是 否 存在 差 
别 ， 那 么 独立 t 检 验 就 是 最 好 的 解决 办 法 。 
































2.7.1 证 明 弗 兰 克 叔 叔 是 错 的 《或 对 的 ) 


为 了 应 用 t 检 验 来 实际 考察 弗兰克 叔叔 的 一 个 理论 ， 我 们 必须 计算 出 一 个 t 值 。 假 设 我 打算 真 
正 挑战 一 下 弗兰克 叔 椒 ， 并 且 收 集 了 一 些 数据 来 检验 他 的 观点 是 否 站 得 住 脚 。 

弗兰克 叔叔 认为 男性 收 到 超速 罚单 的 频次 要 高 于 女性 ,为 了 检验 这 个 假定 , 不 妨 想象 我 从 他 
的 邻居 中 ， 随 机 选取 [Hack #19] 了 两 组 开车 者 ， 每 组 5 人。 其 中 一 组 是 女性 ， 另 外 一 组 是 男性 。 
假设 我 问 了 他 们 一 些 问题 。 结 果 发 现在 过 去 的 5 年 间 ， 男 性 组 平均 收 到 1.71 次 超速 罚单 ， 方 差 大 
小 为 0.71; 女性 组 平均 收 到 1.35 次 超速 罚单 ， 方 差 大 小 为 0.25。 




















方差 是 给 定 一 组 数 中 ,总 的 变 蜡 量 大 小 。 它 是 通过 找 出 群 组 中 每 个 分 数 和 平均 分 数 
的 距离 而 计算 出 来 的 。 将 这 些 距离 进行 平方 并 求 算术 平均 数 就 能 得 到 方差 值 。 


A 
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下 面 是 ! 值 的 计算 方程 式 : 





第 一 组 平均 数 - 第 二 组 平均 数 
| 第 一 组 方差 第 二 组 方差 
第 一 组 样本 大 小 ”第 二 组 样本 大 小 

t 值 越 大 ， 在 你 样本 群体 中 发 现 的 任何 差异 性 为 随机 出 现 的 可 能 性 越 低 。 通 常情 况 下 ， 当 1 值 
大 于 2 就 足以 下 结论 说 ， 差 异 不 仅 存 在 于 你 的 样本 中 ， 也 存在 于 整个 总 体 中 。 








t= 


















































这 里 给 出 的 ! 值 计算 公式 ， 在 两 组 人 数 相同 时 效果 最 好 。 当 两 组 样本 量 不 等 时 ， 会 
采用 一 个 类 似 的 对 变异 信息 求 平 均 的 公式 。 








对 弗兰克 叔叔 的 观点 是 否 得 到 支持 ”为 了 确定 这 一 点 ， 我 们 的 计算 需要 用 到 表 2-9 的 数据 。 


表 2-9: 超速 罚单 检验 数据 





第 1 组 (男性) 第 2 组 (女性 ) 
平均 数 1.71 1.35 
方差 0.71 0.25 
样本 量 15 15 




















如 果 我 们 把 这 些 关键 值 代入 前 面 的 公式 ， 就 会 得 到 : 


1.71-1.35 
0.71 .0.25 
一 一 一 和 二 一 一 一 
15 15 





于 是 得 计算 结果 : i 


0.36 0.36 0.36 
V0.047+0.017 V0.064 0.253 


在 这 种 情况 下 ， 我 们 由 0.36 的 平均 差 计 算出 ! 值 大 小 为 1.42。 





=1.42 





2.7.2 ”解释 tf 值 

















这 个 1.42 大 小 的 t 值 会 是 随机 发 生 的 吗 ? 换 句 话说, 如 果 总 体 中 的 实际 差异 为 零 , 从 这 个 总 体 
中 抽取 的 两 个 样本 平均 值 会 有 那么 大 的 差异 吗 ? 

之 前 我 提 到 过 ， 知 要 得 出 这 个 结论 ， 通 常 需要 1 值 为 2 或 者 更 大 。 在 这 种 标准 下 ， 我 们 会 下 结 
论说 ,没有 证 据 显 示 男 性 的 确 比 女性 接 到 更 多 的 超速 罚单 。 当 然 ,， 在 我 们 的 样本 中 是 这 样 ， 如 果 
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我 们 测量 所 有 人 全 部 总 体 )， 结 果 可 能 就 不 是 这 样 。 没 有 证 据 显示 弗兰克 叔叔 是 对 的 。 虽 然 这 
并 不 等 于 说 他 是 错 的 ， 但 依然 意味 着 他 的 这 个 论点 站 不 住 脚 。 

但 是 , 统计 学 是 讲究 准确 性 的 学 科 ， 所 以 让 我 们 来 进一步 探究 1.42 这 个 值 。t 值 具体 要 达到 多 
大 ， 我 们 才能 下 结论 说 弗兰克 叔叔 真 的 是 正确 的 ? 


依照 惯例 ， 如 果 在 某 一 ! 值 水 平 上 随机 概率 为 5% ( 或 更 小 )， 该 / 值 即 被 视 为 足够 大 。 幸 运 的 
是 ， 从 总 体 中 随机 抽 得 不 同 ! 值 的 几率 ， 已 经 被 辛勤 的 数学 家 们 利用 中 心 极限 定理 [Hack 提 ] 计 算 
出 来 了 。 统 计 显 著 性 需要 的 实际 ! 值 大 小 ,取决 于 两 组 样本 的 总 和 。 表 2-10 提 供 了 达到 0.05 统 计 显 5 
著 水 平 需要 满足 或 达到 的 ! 值 。 
































表 2-10: 随机 出 现 几率 小 于 5% 的 植 





两 组 联合 样本 量 临 表 植 
4 4.30 
20 2.10 
30 2.05 
60 2.00 
100 1.99 
% (无 穷 大 ) 1.96 


对 于 未 包含 在 表 2-10 中 的 样本 量 , 你 可 以 通过 估计 表 中 两 个 1 值 之 间 的 值 ,来 得 出 你 

家。 六 及 满足 达到 的 租 只 的/ 值 。 同 料 ， 该 表 从 定 体 起 于 在 两 个 方向 中 的 任 - 方 向 
定 组 间 的 差异 性 。 它 假定 你 想 要 知道 其 中 任意 一 组 的 平均 数 是 否 大 于 另外 一 组 的 平 
均 数 。 这 就 是 统计 学 家 所 称 的 双 尾 检验 ， 这 通常 是 一 种 有 趣 的 对 比 。 


查阅 表 2-10， 我 们 看 到 1 值 为 1.42 时 ， 小 于 30 个 被 试 总 数 的 临界 值 2.05。 如 果 需 要 有 把 握 地 说 
我 们 观测 到 的 样本 差异 不 只 是 出 于 偶然 ， 那 我 们 需要 看 到 一 个 大 于 2.05 的 ! 值 。 








2.7.3 生效 原理 


社会 科学 家 一 直 在 使 用 这 种 对 比方 法 。 实 验 设计 和 准 实验 设计 总 是 设置 两 组 人 群 , 两 组 间 被 
认为 在 这 样 或 那样 的 方面 存在 差异 。 你 可 能 着 眼 于 共和 党 和 民主 党 之 间 的 差异 , 或 是 男孩 和 女孩 
之 间 的 差异 ， 或 是 想 看 看 服用 新 药 的 群 组 中 患 感冒 的 人 数 是 否 比 不 服用 任何 药物 的 群 组 更 少 。 

这 样 的 设计 会 产生 两 组 分 数 , 它们 的 值 总 是 存在 差异 ,至 少 在 使 用 的 样本 间 存 在 差异 。 研 究 
者 ( 当 需 要 证 明 弗 兰 克 叔叔 是 错误 的 时 候 ,我 也 算是 一 个 研究 者 ) 更 感 兴趣 的 是 ,两 组 样本 所 代 
表 的 总 体 之 间 是 否 存在 差异 。 
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推断 性 统计 的 逻辑 是 : 样本 分 数 代表 一 个 更 大 的 总 体 的 分 数 。 如 果 样 本 在 某 个 变量 
上 存在 差异 ， 那 这 种 差异 也 许 能 被 反映 在 它们 来 自 的 总 体 中 。 还 有 另 一 种 可 能 ， 这 
种 差异 也 许 是 缘 自 取样 误差 。 





检验 回答 了 这 样 一 个 问题 : 两 样本 间 发 现 的 任何 差异 究竟 是 真实 的 ( 即 ， 它 们 很 可 能 存在 于 样 
本 来 自 的 总 体 ), 还 是 缘 自 取样 误差 ( 即 它们 很 可 能 只 存在 于 样本 中 ,总 体 中 不 存在 )。 如 果 样 本 间 
的 差异 太 大 以 至 于 无 法 用 偶然 出 现 来 解释 ， 那么 研究 人 员 就 能 下 结论 说 总 体 间 存 在 真实 的 差异 。 

{检验 公式 使 用 了 样本 分 数 分 布 形状 的 信息 。 我 们 需要 每 组 研究 变量 的 平均 分 数 ， 每 组 的 方 
差 ， 以 及 每 组 的 样本 量 这 几 个 信息 。 样 本 平均 数 提供 了 对 总 体 平均 数 的 很 好 估计 , 方差 指示 样本 
平均 数 可 能 偏离 总 体 平均 数 的 程度 , 样本 量 提 供 了 估计 的 准确 性 。 两 个 平均 数 之 间 的 差异 被 标准 
化 有 旦 用 一 个 1 值 来 表示 。 
































当 统 计 学 家 谈论 真实 差异 时 ， 他 们 会 说 “这 两 个 样本 可 能 来 自 不 同 的 总 体 ”。 而 你 
我 以 及 具体 研究 者 谈论 真实 差异 的 方式 则 可 能 是 “共和 党 和 民主 党 存在 差异 ”， 或 
“此 药物 降低 了 患 感冒 的 几率 ”。 


2.7.4 其 他 生效 领域 


数字 并 不 知道 自身 来 自 何 处 。 你 可 以 用 {检验 去 检查 任意 两 组 数字 的 差异 性 ， 不 管 它们 描述 
的 是 人 还 是 物 。 实 际 上 ， 检 验 的 发 明 ， 最 早 为 了 在 啤酒 生产 中 判断 整 仓 谷物 的 质量 。 

一 名 啤酒 统计 学 家 ( 梦想 中 的 职业 啊 ) 想 要 发 明 一 种 方法 ， 只 需 从 谷物 总 体 中 随机 抽取 一 小 
部 分 样本 进行 查验 ， 而 不 是 检验 所 有 的 谷物 。 剩 下 的 故事 就 是 历史 了 。 所 以 我 们 今天 可 以 说 , 统 
计 研 究 人 员 所 做 的 大 部 分 工作 的 的 确 确 是 由 啤酒 驱动 的 。 


1 Wy 2 看 清 实际 错误 程度 
汪 攻 启 仁 何 时 候 你 使 用 贷 计 量 来 概括 观测 数据 ， 你 都 有 可 能 犯 化 。 如 果 你 需要 知道 自己 已 
经 多 么 接 诉 真相 ， 可 以 使 用 标准 误差 这 个 工具 。 
































在 专业 人 士 当 中 , 或 许 唯 有 统计 学 家 不 仅 自 豪 地 承认 自己 的 答案 可 能 出 错 ， 而 且 会 想 尽 办 法 
精确 地 告诉 你 ,他们 实际 上 错 到 什么 程度 。 当 你 执行 一 项 调查 ,记录 观测 数据 ， 或 是 执行 某 种 类 
型 的 实验 ,你 的 结果 所 描述 的 仅仅 是 你 的 样本 一 一 你 面前 的 顾客 、 患 者 、 学 生 、 金 鱼 或 是 成 片 的 
氮气 石 。 推 断 性 统计 利用 样本 算出 的 值 来 估计 样本 代表 的 总 体 中 相应 值 的 大 小 。 比 如 ,根据 样本 
中 的 平均 数 可 以 很 好 地 估计 出 总 体 的 平均 数 。 问 题 是 你 要 知道 是 否 应 当 信 任 你 的 结果 。 
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2.8.1 校准 误差 并 计算 精确 性 

一 个 样本 的 平均 数 不 太 可 能 和 总 体 平均 数 完 全 一 样 , 但 很 可 能 接近 总 体 平均 数 。 如 果 你 想 要 
知道 自己 的 错误 程度 , 那么 能 用 标准 误差 来 校正 你 的 准确 性 。 通 过 平均 数 的 标准 误差 , 可 以 大 致 
估计 出 根据 样本 得 出 的 估计 平均 数 和 实际 总 体 平均 数 之 间 的 差距 。 

















a ne 
型 表现 水 平 有 多 接近 。 正 如 测量 使 得 我 们 能 够 计算 个 体 观测 分 数 附 近 95% 的 置信 区 
间 ， 统 计 学 家 通常 针对 众多 样本 值 计 算 其 附近 95% 的 置信 区 间 。 


幸好 ,对 于 任何 想 了 解 统 计 发 现 和 潜在 真相 之 间 差 忠 有 多 远 的 人 来 说 , 每 个 流行 的 统计 方法 
都 会 提供 一 个 标准 误差 ,在 介绍 完 下 面 的 基本 概念 后 ,本 节 接 下 来 会 解释 如 何 运 用 这 些 标准 误差 。 
口 描述 性 统计 中 的 平均 数 标准 误差 。 
口 调查 取样 中 的 比例 标准 误差 。 
口 回归 中 的 估计 标准 误差 。 











在 取样 时 ， 中 心 极限 定理 [Hack #2] 是 了 解 我 们 错误 程度 的 关键 工具 ， 因 为 它 提 供 了 
计算 标准 误差 的 公式 并 且 提 示 所 有 样本 概括 值 均 呈正 态 分 布 。 





利用 标准 误差 来 核实 统计 分 析 结果 的 准确 性 ,常用 的 方式 有 三 种 。 选 择 哪 个 特定 工具 ,取决 
于 你 是 否 想 知道 自己 在 多 大 程度 上 接近 正确 的 估计 。 
口 某 个 变量 的 总 体 平均 分 ( 例如 ， 无 任期 保障 的 大 学 教授 的 平均 工资 )。 
口 总 体 中 拥有 某 个 特征 的 成 员 所 占 比例 ( 例如 ， 哪 些 人 会 投票 支持 我 叔叔 弗兰克 担任 捕 
狗 员 )。 
口 未 来 的 表现 〈 比如， 你 那 只 受过 选择 题 答题 训练 的 宠物 猴 可 能 获得 的 大 学 GPA 成 绩 )。 














2.8.2 ”平均 数 估 计 

样本 平均 数 作为 总 体 平 均 数 估计 值 的 准确 性 是 以 样本 量 为 基础 的 。 其 计算 公式 如 下 : 
标准 差 
\ 样 本 大 小 

随 着 样本 量 的 增加 ,样本 平均 数 越 来 接近 于 真实 的 总 体 平均 数 。 如 果 你 将 样本 量 想象 成 独 
立 观测 数量 的 话 , 这 个 现象 就 能 讲 得 通 了 : 你 对 一 件 事物 的 观测 次 数 越 多 , 你 的 描述 就 越 准 确 。 














平均 数 标准 误差 
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ww 平均 数 的 标准 误差 是 众多 样本 的 平均 数 与 其 总 体 平均 数 距离 的 平均 数 。 


2.8.3 比例 估计 


当 调 查 一 群 人 组 成 的 样本 ,并 且 结 果 用 某 个 百分比 或 比例 来 呈现 时 ( 比如，72% 的 水 手 患 有 
膝 部 关节 炎 )， 那 么 这 个 百分比 会 与 调查 整个 总 体 得 出 的 实际 百分比 存在 一 定 距离 。 如 果 这 个 样 
本 是 随机 选取 的 ， 那么 比例 标准 误差 就 表示 样本 百分比 和 总 体 百分比 的 接近 程度 。 

比例 的 标准 误差 基于 样本 量 和 比例 的 大 小 。 其 计算 公式 如 下 : 























(比例 )d =- 比例 ) 
样本 大 小 
和 平均 数 的 标准 误差 一 样 ， 随 着 样本 量 增 加 ， 比 例 的 标准 误差 会 降低 。 如 果 你 有 数学 头脑 ， 
你 也 许 会 注意 到 ， 这 个 比例 偏离 0.50 的 程度 越 大 ， 公 式 上 半 部 分 的 数字 就 变 得 越 小 。 
因此 ， 当 我 们 进行 计算 时 ,样本 比例 偏离 0.50 的 程度 越 大 ， 比 例 的 标准 误差 就 越 低 。 另 一 个 有 
趣 之 处 是 ， 公 式 的 顶部 是 样本 变异 量 的 指示 。( 比 例 )(1- 比 例 ) 是 比例 标准 差 的 平方 。 





比例 标准 误差 = 











A 比例 的 标准 误差 是 样本 比例 和 总 体 真 实 比例 之 间距 离 的 平均 。 


2.8.4 ”对 未 来 表现 的 估计 

在 回归 分 析 里 , 用 一 个 变量 或 多 个 变量 上 的 分 数 来 估计 男 一 个 变量 的 分 数 [Hack #13]。 但 是 ， 
被 预测 的 分 数 很 可 能 不 完全 正确 。 

正如 我 们 能 够 计算 样本 平均 数 和 总 体 平均 数 之 间距 离 的 平均 值 , 或 者 我 们 的 调查 结果 和 理论 
总 体 结果 之 间 的 距离 ,我 们 同样 能 够 算出 ,平均 来 说 , 我 们 的 回归 预测 结果 和 某 个 人 实际 获得 分 
数 的 距离 是 多 少 。 其 计算 公式 如 下 : 














估计 标准 误差 = 标准 差 V1 一 相关 系数 ? 


方程 式 中 用 到 的 标准 差 是 效 标 变量 的 标准 差 , 效 标 变量 就 是 你 预测 的 变量 。 相 关系 数 是 你 的 
预测 变量 和 效 标 变量 间 的 相关 。 











差 的 估计 公式 不 完全 正确 。 但 是 ， 它 提供 的 结果 和 这 个 更 为 复杂 而 正确 的 公式 几乎 
一 样 。 


x 为 了 提高 准确 性 (毕竟 本 条 Hack 的 重点 就 在 于 此 )， 我 应 该 指出 之 前 给 出 的 标准 误 
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全 ;、 样 本 大 小 一 1 

他 计 标准 训 关 -标准 关 q r J 
注意 ，i We 相关 系数 越 大 ， 估 计 的 标准 误差 就 越 小 。 这 是 合理 的 ， 因 为 如 果 两 个 
变量 间 有 很 多 信息 ， 你 就 能 通过 观察 一 个 变量 的 分 数 ， 对 另 一 变量 的 分 数 形成 很 好 的 


概念 。 


ww 估计 的 标准 误差 是 实际 分 数 和 每 个 预测 分 数 之 间距 离 的 平均 值 。 


2.8.5 ”标准 误差 的 运用 

以 下 是 如 何 使 用 这 些 方法 ,从 而 有 一 定 把 握 来 断定 真相 落 在 哪个 区 间 。 因 为 取样 误差 是 正 态 
分 布 的 ， 标 准 误差 可 以 和 标准 差 一 样 ， 用 来 定义 在 正 态 曲线 下 分 数 的 特定 比例 。 

比如 说 ， 如 果 想 要 提供 一 个 总 体 的 值 有 95% 落 入 其 中 的 值 范围 ， 我们 可 以 围绕 我 们 的 样本 值 
建立 95% 的 置信 区 间 。 基 于 正 态 曲线 [Hack #23], 样本 值 左 右 1.96 个 标准 误差 应 该 能 够 提供 一 个 范 
围 值 ， 我 们 能 有 95% 的 把 握 说 这 个 范围 值 包含 了 总 体 的 值 。 

表 2-11 展 现 了 一 些 标准 误差 ， 以 及 使 用 样本 数据 来 计算 置信 区 间 [Hack #6] 的 例子 。 注 意 一 个 


更 大 的 样本 是 如 何 创建 一 个 更 接近 总 体 值 的 样本 估计 , 同样 , 更 大 的 样本 量 会 指向 一 一 个 更 加 准确 
的 置信 区 间 。 






































表 2-11: 建立 95% 的 置信 区 间 





标准 误差 类 型 标准 差 样本 量 样本 值 标准 误差 95% 置 信和 区间 
平均 数 标准 误差 15 30 100 2.74 94.63~105.37 
平均 数 标准 误差 15 60 100 1.94 96.20~103.80 
比例 标准 误差 0.25 30 0.50 0.09 0.32~0.68 
比例 标准 误差 0.25 60 0.50 0.06 0.38~0.62 
估计 标准 误差 15 30 100 14.81 70.97~129.03 











估计 标准 误差 15 60 100 14.65 71.29~128.71 


表 2-11 中 估计 标准 误差 所 对 应 的 “样本 值 ” 那 一 列 ， 是 对 某 个 变量 的 估计 或 预测 分 
数 的 例子 。 例 子 中 的 这 两 个 计算 假定 预测 变量 和 效 标 变量 之 间 的 相关 系数 是 0.25。 


2.8.6 ”弗兰克 叔叔 的 捕 狗 员 竞 选 
我 板 板 弗兰克 最 近 在 竞选 捕 狗 员 职 位 , 作为 他 的 竞选 经 理 , 我 有 机 会 使 用 我 掌握 的 标准 误差 
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知识 。 在 竞选 的 前 几 周 ， 我 在 弗兰克 叔叔 居住 的 堪萨斯 的 Tonganoxie 镇 随机 调查 了 30 名 投票 人 。 
我 的 调查 显示 50% 的 受 访 者 表示 会 投 我 权 叔 一 票 。 我 警告 厚 兰 克 叔 板 ， 这 个 样本 太 小 ,不 能 非常 
准确 地 反映 全 体 投票 者 的 意愿 。 

在 查阅 表 2-11 后 ， 我 认为 如 果 对 全 镇 所 有 的 投票 人 进行 调查 ， 他 们 把 票 投 给 弗兰克 的 百分比 
可 能 会 合理 地 落 在 32% 和 68% 之 间 ， 虽 然 最 可 能 的 值 是 50%。 当 然 ， 我 板 叔 这 个 乐观 主义 者 ， 将 
这 解释 为 他 可 能 有 68% 的 选票 ， 因 此 拥有 巨大 的 领先 优势 。 他 将 剩余 的 竞选 专用 款 都 花 在 了 一 场 
大 型 选 前 庆功 训 上 。 作为 一 个 现实 主义 者 , 而且 深 知 我 权 叔 在 小 镇 里 的 名 声 , 我 本 人 认为 结果 会 
朝 相 反 的 方向 发 展 。 结 果 的 确 如 此 。 但 那 没什么 关系 。 那 是 一 场 不 错 的 宴会 。 


























2.8.7 生效 原理 
如 果 我 们 遵循 下 面 的 假设 并 运用 一 些 常识 ， 我 们 就 能 信任 标准 误差 的 准确 性 。 
@ 取样 误差 是 正 态 分 布 的 


这 意味 着 这 些 误差 的 大 小 以 一 种 符合 正 态 曲线 的 形式 分 布 。 这 样 我 们 就 能 够 计算 这 些 有 足够 
说 服 力 的 准确 的 置信 区 间 。 


@ 取样 误差 是 无 偏 的 








研究 ， 我 们 可 以 逐渐 接近 真正 的 总 体 值 。 

公式 以 这 样 一 种 形式 构建 : 如 果 你 拥有 少量 总 体 信息 或 没有 总 体 信 息 , 样本 估计 中 的 误差 大 
小 约 等 于 总 体 中 标准 差 的 大 小 。 

看 看 样本 量 为 1 的 时 候 ， 平 均 数 的 标准 误差 或 是 比例 的 标准 误差 会 是 多 少 ， 或 者 ， 当 相关 系 
数 是 0.00 时 ， 佑 计 的 标准 误差 会 是 多 少 。 直 观 来 看 ， 一 个 好 的 计算 标准 误差 大 小 的 公式 应 该 做 到 
总 体 信息 越 多 ， 产 生 的 误差 越 小 。 














HACK 2.9 公正 取样 
9 如 果 你 想 了 解 企业 的 每 位 顾客 次 员 工 的 情况 ， 可 以 我 他 们 每 一 个 人 谈话 。 如 果 你 关 
注 自 家 酒吧 里 出 售 的 啤酒 质量 ， 可 以 在 上 酒 前 把 每 一 杯 都 党 一 党。 或 者 ,为 了 节约 
时 间 、 人 金钱 和 上 脑 细胞 ， 不 妨 代 之 以 高 效 的 “取样 “。 
健康 的 管理 有 赖 于 熟 说 每 个 产品 细节 、 每 一 笔 交 易 和 每 一 位 客户 的 特点 。 当 然 , 你 永远 无 法 


将 所 有 这 些 产 品 、 交 易 和 人 整体 都 带 到 同一 个 显微镜 下 进行 观察 和 评估 , 因为 没有 足够 大 的 样本 
载 玻 片 。 
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在 社会 科学 领域 也 是 一 样 ， 以 人 作为 研究 对 象 的 学 者 不 可 能 测量 每 一 个 人 。 就 算 我 们 有 心 尽 
可 能 多 地 刺探 隐私 ， 惊 动 别 人 ,， 打 断 人 家 的 事务 ， 给 人 添 麻 烦 ， 让 人 二 从 ， 换 句 话 说 就 是 打搅 世 
界 上 的 每 个 人 ， 也 不 可 能 做 到 。 我 们 没有 足够 的 时 间 、 空 间 和 金钱 ， 坦 率 地 说 ， 没 人 真 的 想 要 了 
解 这 么 多 人 。 

需要 面 对 的 问题 是 :“ 如 果 不 一 一 查看 ， 又 怎 能 了 解 每 件 事 ?” ”正如 这 本 书 介绍 的 所 有 Hack 
一 样 ,， 统计 学 能 提供 解决 办 法 。 有 很 多 科学 合理 的 方法 ,让 你 通过 观察 任何 事物 的 一 小 部 分 ,就 
能 准确 描述 其 总 体 。 

2.9.1 使 用 样本 进行 推论 

推断 性 统计 使 我 们 能 够 基于 小 量 的 样本 数据 ,引出 一 般 性 的 总 体 结论 。 然 而 ， 要 使 这 种 推广 
有 效 ， 样 本 必须 公正 地 代表 总 体 。 

< 总 体 ， 按 照 这 里 使 用 的 意思 来 看 ， 极 少 等 同 于 社会 学 研究 用 语 中 “一 个 国家 、 城 市 

或 星球 的 全 体 居 民 ” 的 意思 。 在 推断 性 统计 中 ,总体 一 词 描 述 的 是 作为 研究 对 象 的 
某 一 类 人 或 事物 。 比 如 ， 内 布 拉 斯 加 州 所 有 小 学 三 年 级 的 男生 ， 堪 萨 斯 州 梅 利 亚 姆 
市 肖 尼 米 什 医疗 中 心 (Shawnee Mission Medical Center ) 的 护士 ， 南 美 巨型 水 猎 ， 
或 是 美国 国会 图 书馆 的 藏书 。 唯 一 的 规则 是 总 体 要 大 于 其 对 应 的 样本 。 

一 个 良好 的 样本 能 代表 一 个 总 体 。 这 意味 着 总 体 中 每 个 重要 特征 的 分 布 必须 和 样本 中 这 些 特 
征 的 分 布 成 比例 。 本 项 Hack 大 部 分 都 是 关于 如 何 构建 一 个 良好 样本 的 , 所 以 我 们 先 来 看 一 个 好 的 
样本 。 

想象 一 个 由 正方 形 、 蔡 形 和 三 角形 构成 的 总 体 ， 如 图 2-4 所 示 。 
















































































图 2-4: 总 体 中 的 一 个 样本 
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从 正方 形 、 蒙 形 和 三 角形 构成 的 总 体 中 抽取 一 个 公正 的 样本 ,其 中 包含 这 些 形状 ， 比 例 与 它 
们 在 总 体 中 的 比例 相等 。 在 示意 图 中 , 外 层 的 椭圆 代表 一 个 总 体 , 其 中 不 同形 状 的 分 布 比例 如 下 : 
正方 形 占 40%， 三 角形 占 20% ， 鞭 形 占 40%。 内 层 的 椭圆 代表 样本 ， 包 含 着 总 体 中 这 些 元 素 的 一 
个 子 集 。 样 本 中 各 种 形状 的 比例 分 布 和 与 总 体 中 各 种 形状 的 比例 分 布 相 同 : 40% 的 正方 形 ，20% 
的 三 角形 ， 还 有 40% 的 芬 形 。 

这 个 样本 是 公正 的 。 它 很 好 地 代表 了 总 体 ， 至 少 在 形状 特征 上 如 此 。 当 对 人 或 对 物 取 样 时 ， 
样本 通常 呈现 出 多 种 多 样 的 特质 。 人 或 物 不 完全 是 三 角形 或 正方 形 , 所 以 对 于 一 个 由 人 构成 的 样 
本 来 说 , 当 其 中 某 种 特质 的 平均 水 平 很 好 地 匹配 了 总 体 水 平 , 这 个 样本 便 具 有 代表 性 。 在 本 例 中 ， 
各 种 形状 均 为 单一 特质 ， 而 人 则 不 然 ， 各 种 特质 在 一 个 人 身上 可 能 或 多 或 少 地 都 有 所 呈现 。( 尽 
管 根据 我 姓 娘 海 洛 稚 兹 的 说 法 ， 我 叔叔 弗兰克 是 个 “方正 ”* 至 极 的 人 。 ) 






































提出 问题 的 人 必须 选择 他 感 兴趣 的 总 体 , 其 后 他 引出 的 结论 只 针对 那个 总 体 时 才 是 
正确 的 ， 而 不 适用 于 任何 其 他 总 体 。 





如 果 你 知道 构建 该 样本 ( 内 层 椭圆 中 的 元 素 ) 的 采样 方法 是 正确 的 , 那么 你 可 以 仅 通过 观测 
样本 来 得 出 总 体 推论 。 其 方法 简单 而 又 直观 。 

(1) 观测 样本 。 比 如 ， 样 本 中 三 角形 占 20%。 

(2) 对 总 体 进 行 推论 。 我 敢 说 三 角形 在 总 体 中 占 20%。 

我 们 且 把 理论 总 体 中 的 抽象 三 角形 放 在 一 边 , 来 看 一 个 具体 的 例子 。 假设 你 想 检 查 自己 酒吧 
里 出 售 的 啤酒 质量 。 为 了 解 啤酒 的 总 体质 量 ， 你 需要 构建 一 个 良好 的 在 售 啤酒 样本 ， 然 后 逐一 品 
尝 样 本 。 

(1) 观测 样本 。 比 如 说 ， 其 中 20% 余 味 发 蚀 。 

(2) 对 总 体 进行 推论 。 我 敢 说 你 售卖 的 啤酒 里 余味 发 馈 的 占 20%。 你 可 能 需要 清理 啤酒 龙头 。 

推论 很 容易 做 ,但 只 有 当 样 本 良好 时 ， 推 论 才 是 有 效 的 。 关 键 是 构建 一 个 良好 的 样本 。 
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2.9.2 ”构建 最 好 的 随机 样本 

良好 的 样本 代表 了 总 体 。 代 表 性 取样 首先 得 定义 好 全 集 ， 即 研究 者 想 要 从 中 取样 的 总 体 。 在 
选择 总 体 和 选择 样本 时 ,对 元 素 和 各 种 隐 性 或 显 性 的 分 组 层级 进行 概念 化 的 方法 有 很 多 种 。 你 必 
须 了 解 这 些 组 织 总 体 的 方式 ， 和 否则 就 无 法 创建 好 的 样本 。 


























注 2: square 除 了 指 方形 以 外 ， 还 有 为 人 诚实 公正 之 意 。 一 一 译 者 注 
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@ 通用 全 集 

研究 者 希望 将 其 结论 推 而 广 之 的 抽象 总 体 。 比 如 ， 我 针对 的 可 能 是 所 有 的 漫画 书 收藏 者 。 

@ 可 操作 全 集 

可 进行 抽样 的 具体 总 体 。 比 如 , 我 不 能 完全 确定 自己 已 经 找到 或 计算 出 了 所 有 的 漫画 书 收藏 
者 ,但 我 能 通过 将 其 定义 成 “所 有 的 《漫画 买 家 指南 》( 一 本 大 多 数 认真 的 收藏 者 都 会 阅读 的 月 
刊 ) 订阅 者 ”"， 将 总 体 变 得 可 操作 化 。 这 种 可 操作 总 体 不 完全 等 同 于 通用 全 集 ， 但 它 应 该 几乎 和 
抽象 总 体 一 样 大 ， 而 且 能 包 纳 研究 者 关注 的 抽象 总 体 中 的 大 多 数 。 

@ 抽样 单元 

指定 义 总 体 的 元 素 。 在 本 例 中 ， 每 位 杂志 订阅 者 就 是 一 个 抽样 单元 。 

@ 抽样 框架 

指 总 体 中 抽样 单元 的 列表 , 无 论 是 真实 的 还 是 想象 的 。 在 本 例 中 ,抽样 框架 是 杂志 订阅 者 列 
表 ， 我 也 许 能 够 从 杂志 编辑 部 买 到 。 























如 果 一 个 观察 结果 对 于 样本 范围 之 外 的 人 或 事物 可 能 有 效 , 我们 称 之 为 可 泛 化 推广 
的 。 如 果 一 个 样本 不 代表 一 个 总 体 ， 那 么 这 个 样本 就 是 有 偏 样本 ( 一 个 坏 样 本 )。 


毫 无 疑问 , 最 好 的 抽样 策略 是 从 有 效 的 抽样 框架 中 随机 抽样 。 随 机 选择 能 够 最 好 地 创建 一 个 
能 代表 总 体 中 所 有 被 关注 特质 的 样本 。 但 是 ， 随 机 选择 的 真正 力量 在 于 , 抽样 结果 也 代表 了 你 根 
本 没 考虑 到 的 、 可 能 影响 到 观测 结果 的 所 有 类 型 的 变量 。 

从 技术 上 讲 ,“ 随 机 ”这 个 词 描述 了 这 样 一 个 抽样 过 程 : 它 给 予 总 体 中 每 一 个 成 员 相同 和 独 
立 的 入 选 机 会 。 相 同意 味 着 抽样 框架 中 的 每 个 抽样 单元 和 其 他 抽样 单元 拥有 同样 的 机 会 。 独 立意 
味 着 一 个 人 或 一 件 事 被 选中 的 几率 和 其 他 特定 的 人 或 事 是 否 被 选中 没有 关联 。 

所 以 , 假设 有 这 样 一 个 选择 过 程 : 按 客户 名 单打 电话 ,询问 他 们 是 否 愿 意 参与 活动 , 但 如 果 
第 一 次 致电 发 现 该 客户 不 在 家 或 者 不 在 办 公 室 , 就 放弃 继续 联系 , 这 种 做 法 没有 给 予 所 有 可 能 的 
参与 者 相同 的 人 选 几率 , 不 容易 联系 的 人 被 选中 的 可 能 性 较 小 。 如 果 一 个 办 公 室 里 有 人 被 选中 时 ， 
就 不 再 邀请 同 办 公 室 的 其 他 人 ， 那 么 总 体 中 每 个 成 员 的 入 选 几 率 就 不 是 独立 的 。 

随机 抽样 可 以 通过 这 种 方式 来 完成 : 用 数字 标记 抽样 框架 列表 里 的 所 有 和 名字, 然后 用 某 种 随 
机 数字 选取 法 来 选择 每 个 被 试 。 

































































2.9.3 ”现实 世界 的 抽样 策略 
在 现实 世界 里 ， 随 机 抽样 往往 很 难 或 者 说 是 不 可 能 的 。 下 面 是 一 些 抽样 策略 ， 虽 然 不 如 随机 
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抽样 ， 但 在 一 些 想象 的 科学 实验 室 之 外 ， 却 更 加 现实 。 

@ 方便 抽样 

样本 选择 基于 可 得 性 。 有 时 候 也 称 作 偶 遇 抽样 。 去 本 地 购物 中 心 , 询问 你 最 先 遇 到 的 10 个 人 ， 
了 解 他 们 对 你 公司 产品 的 态度 ， 这 就 是 方便 抽样 。 

@ 系统 抽样 

单元 是 从 抽样 框架 中 等 距 抽 取 的 。 比 如 ， 你 可 能 会 从 一 个 很 长 的 人 员 列 表 中 着 10 抽 取 一 个 。 
只 要 列表 中 的 人 名 顺序 和 你 要 判断 的 内 容 没 有 关联 , 这 个 方法 对 总 体 的 代表 性 可 能 不 亚 于 真正 的 
随机 选择 。 关 于 这 个 问题 ， 统 计 学 理论 家 和 实践 家 之 间 实 际 上 存在 一 些 学 术 争 论 。 

@ 分 层 抽样 

抽样 框架 被 分 成 有 意义 的 子 群 组 , 单元 是 从 每 个 子 群 组 里 随机 抽取 的 。 如 果 定 义 子 群 组 的 特 
质 对 你 提 的 问题 很 重要 ， 那 么 这 种 方法 可 能 会 产生 一 个 比 随机 抽样 更 具 代 表 性 的 结果 。 

@ 整 群 抽样 

单元 群 组 是 随机 选择 的 ， 这些 群 组 中 的 单元 都 作为 样本 。 例如 ,你 可 能 会 随机 选择 一 家 出 版 
公司 ， 然 后 就 如 何在 出 版 界 取 得 成 功 的 话题 访谈 每 一 位 员工 。 

e 判断 抽样 

其 样本 的 选择 是 基于 你 的 专业 判断 , 决定 这 个 样本 能 否 代表 总 体 。 你 也 许 会 选择 只 和 最 佳 客 
户 们 谈话 ， 因 为 他 们 对 你 的 产品 最 了 解 。 


























2.9.4 选择 样本 量 

如 果 你 能 构建 一 个 符合 上 述 定义 的 良好 的 样本 , 那么 即便 是 小 样本 也 可 以 有 效 。 不 过 ,就 像 
巧克力 脆 片 曲 奇 饼 的 例子 一 样 , 我 们 的 样本 也 是 越 大 越 好 。 样本 量 越 大, 就 越 能 代表 总 体 。 因 此 ， 
这 样 的 观测 结果 更 具有 可 泛 化 推广 性 ， 你 也 能 更 加 确信 其 准确 性 。 

同样 ， 如 果 观 测 显 示 ， 变 量 之 间 存 在 某 种 有 趣 的 相关 ， 而 且 当 你 观测 样本 中 的 多 个 元 素 时 ， 
发 现 此 种 相关 的 可 能 性 肯定 比 只 观察 少量 元 素 时 更 大 ， 你 便 能 确信 这 种 相关 不 是 随机 发 生 的 。 

最 后 , 如 果 你 的 抽样 的 确 出 于 某 种 社会 科学 的 假设 , 那么 在 技术 上 必须 符合 特定 的 统计 特征 
才能 进行 某 种 分 析 。 在 大 样本 中 ( 壁 如 包含 30 个 或 更 多 部 件 的 样本 )， 这 些 标准 更 容易 满足 。 























2.9.5 参阅 
“看 清 实 际 错误 程度 ”[Hack #18] 介 绍 了 如 何在 推断 性 统计 中 确定 误差 大 小 。 
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1 210 品尝 苏格兰 威士忌 抽样 
VA 当 筑 计 党 家 从 冯 体 中 选取 人 群 样本 时 ,他 们 实际 上 本 从 这 续 分 布 的 变量 中 抽样 。 不 过 
有 此 时 候 ， 当 你 把 变量 看 作 离散 对 象 而 不 是 连 闭 分 数 时 ， 更 容易 理解 抽样 的 概念 。 


一 些 最 强大 的 统计 方法 ,是 在 等 距 测量 或 更 高 层次 上 [Hack #7] 使 用 分 数 进行 测量 。 但 是 , 社 
会 科学 研究 人 员 从 总 体 中 抽取 分 数 时 ， 总 是 选择 人 而 不 是 分 数 。 然 后 对 人 进行 测量 , 产生 一 个 分 
数 的 样本 。 迄 今 为 止 ， 这 种 做 法 的 效果 一 直 很 好 。 

但 是 ,说 到 抽样 过 程 ， 精 明 的 研究 人 员 在 取样 策略 上 有 时 似乎 并 不 那么 精明 。 比 如 ， 如 果 一 
个 研究 者 有 意 测量 某 个 连续 变量 上 的 作用 效果 , 比如 幸福 感 , 他 也 许 会 说 ( 并且 这 么 想 ):“ 好 的 ， 
首 移 我 需要 一 个 样本 ， 其 中 只 包含 幸福 的 人 和 不 笠 福 的 人 。” 至少 在 这 个 思考 的 瞬间 ， 他 是 把 幸 
福 感 作为 一 个 二 分 变量 来 看 待 的 。 
































二 分 是 一 个 统计 术语 ， 表 示 “ 只 有 两 个 值 "。 比 如 ， 生 理 上 的 性 别 就 是 一 个 二 分 
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在 他 眼中 ， 人 们 要 么 完全 第 福 ， 要 么 完全 不 幸福 。 当 然 ,， 在 现实 生活 中 ,他 知道 描述 幸福 感 
的 分 数 范围 区 间 是 很 广 的 ， 正 因 如 此 ， 他 才 用 统计 量 做 等 距 测量 假设 。 

他 把 他 的 被 试看 做 非 此 即 彼 〈 即 不 是 幸福 就 是 不 幸福 )， 是 因为 这 么 做 能 让 他 更 容易 描绘 其 
抽样 的 代表 性 。 这 是 一 个 聪明 的 策略 ， 因 为 通过 把 样本 视 作 大 的 分 类 变量 的 代表 ， 而 不 是 更 精确 
的 连续 值 ， 有 时 候 能 让 抽样 问题 变 得 更 容易 回答 和 证 明 。 














2.10.1 一 个 抽样 问题 


请 看 一 个 聚焦 于 抽样 问题 的 难题 。 一 个 喝 醇 了 的 、 无 任期 教 职 的 统计 学 家 (我 见 过 不 少 ) 正 
在 一 个 聚会 上 调 酒 ,他 在 为 他 的 系 主任 做 威士忌 苏打 。 主 任 要 求 威 士 鼠 和 水 达到 某 一 精确 比例 ( 具 
体 数 字 是 多 少 并 不 重要 ， 因 为 我 们 的 主人 公 永 远 做 不 到 那 一 步 )。 

这 位 统计 学 家 首先 找 来 两 个 容量 相同 的 杯子 。 第 一 杯 威 有 2 次 司 苏格兰 威 士 鼠 ; 第 二 杯 威 有 2 
次 司 水 。 他 开始 从 盛 水 的 杯子 里 往 盛 有 威 士 鼠 的 杯子 里 倒 了 1 益 司 的 水 。 显 然 ， 他 已 经 搞 砸 了 ， 
因为 他 改变 主意 了 , 他 把 刚 竞 好 的 混合 液体 (3 抑 司 威 士 鼠 和 水 的 混合 物 ) 又 倒 回 了 1 淮 司 到 盛 水 
的 杯子 里 。 现 在 两 个 杯子 里 都 有 2 盘 司 的 液体 ， 但 每 杯 的 液体 均 为 某 种 比例 的 水 和 威士忌 的 混 
合 物 。 


这 名 统计 学 家 很 紧张 ， 他 试图 重新 开始 ， 但 是 被 系 主 任 拦住 了 。 系 主任 对 他 说 : 
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“我 有 个 提议 : 现在 我 们 不 可 能 知道 每 只 杯子 里 威士忌 和 水 的 确切 比例 ， 因 为 我 们 
不 知道 它们 是 怎么 混合 的 。 但 是 ， 如 果 你 能 正确 回答 下 面 的 问题 ， 我 就 为 你 向 教 职 评定 
委员 会 写 一 封 强 有 力 的 推荐 信 。 如 果 你 答 错 了 ， 那 么 我 可 以 肯定 ， 凭 你 的 资质 ， 在 酒店 / 
汽车 旅馆 或 是 食品 服务 业 找 份 工作 应 该 不 成 问题 。 我 的 问题 是 这 样 的 : 现在 ,是 第 一 杯 
里 的 水 多 一 些 ， 还 是 第 二 杯 里 的 威士忌 多 一 些 ? ” 


可 以 把 这 个 问题 想象 为 抽样 问题 。 是 第 一 个 样本 ( 即 第 一 杯 里 的 液体 ) 中 含有 更 多 的 水 ,还 
是 第 二 个 样本 ( 即 第 二 杯 里 的 液体 ) 中 含有 更 多 的 威 士 鼠 ?因为 威 士 鼠 和 水 均 由 细小 的 粒子 组 成 ， 
很 难 想 象 每 个 样本 代表 的 每 种 液体 的 量 。 即 使 按 比 例 算 , 我 们 也 不 能 确定 有 多 少 水 粒子 (或 者 说 
“水 ”的 样本 分 数 ) 混入 了 “ 威 士 鼠 ”的 样本 分 数 ， 因 为 没 人 知道 有 多 少 水 沉 到 第 一 杯 的 标底 部 
分 ， 同时 有 多 少 留 在 顶部 的 酒 被 倒 回 了 第 二 杯 。 这 时 人 们 需要 凭 直觉 给 出 答案 。 令 人 和 遗憾 的 是 ， 
这 个 答案 是 错误 的 。 

聪明 人 通常 想到 的 直观 答案 是 : 第 一 个 杯子 ( 即 开始 盛 有 威士忌 那 杯 ) 比 开始 盛 水 、 后 来 又 
挫 和 威士忌 的 那 一 杯 里 的 水 更 多 。 这 似乎 说 得 通 ， 因 为 起 初 倒 进 威士忌 里 的 是 纯 水 ， 而 后 来 被 倒 
回 水 杯 的 则 是 水 和 威士忌 的 混合 物 。 令 人 惊讶 的 是 ,这 个 聪明 的 想法 把 我 们 引入 了 迷途 。 正 确 答 
案 是 两 个 杯子 里 混合 物 的 比例 完全 相等 ! 威士忌 杯 中 的 水 和 水 杯 中 的 水 含量 相同 。 



































2.10.2 使 用 比喻 来 解决 问题 


如 果 我 们 把 此 例 中 的 变量 想象 成 某 种 较 大 的 物体 ， 比 如 蓝 色 和 白色 的 弹 珠 , 而 不 是 细微 的 粒 
子 ， 那 么 问题 的 答案 会 显得 更 清楚 。 把 一 杯 威 士 忌 想 象 成 一 只 装 有 100 个 蓝 色 弹 珠 的 杯子 。 把 一 
杯 水 想象 成 一 只 装 有 100 个 白色 弹 珠 的 杯子 。 

假设 杯子 很 大 , 所 以 里 面 的 弹 珠 能 够 很 好 地 相 混 , 就 像 混合 液体 一 样 。 想 想 那 种 大 玻璃 鱼 饶 。 
这 对 确保 选择 的 随机 性 很 有 必要 。 注 意 ， 睁 大 眼睛 ， 在 混合 的 每 一 步 牢 牢 盯 住 这 些 弹 珠 。 

我 们 的 主人 公 从 第 二 个 杯子 拿 出 50 个 白色 弹 珠 , 将 它们 混 进 第 一 个 杯子 。 现 在 这 两 个 变量 的 
分 布 是 : 

@ 样本 1 

100 个 蓝 色 弹 珠 ，50 个 白色 弹 珠 
@ 样本 2 

50 个 白色 弹 珠 


现在 ， 他 又 从 第 一 个 杯子 里 随机 取出 50 个 弹 珠 〈 记 住 是 随机 的 ， 以 便 模 拟 液体 的 混合 )， 然 
后 将 它们 混合 到 第 二 个 杯子 里 。 让 我 们 想象 一 下 各 种 可 能 的 结果 。 















































2.10 品尝 苏格兰 威士忌 抽样 71 








如 果 他 碰巧 选 的 全 是 白色 弹 珠 ， 那 么 这 些 白 色 弹 珠 回 到 了 第 二 个 杯子 ， 现 在 的 分 布 情 
况 是 : 

@ 样本 1 

100 个 蓝 色 弹 珠 

@ 样本 2 

100 个 白色 弹 珠 

如 果 碰 巧 他 连 一 个 白色 弹 珠 都 没有 选 到 , 而 是 把 50 个 蓝 色 弹 珠 放 到 了 第 二 个 杯子 里 , 那么 分 
布 就 是 : 

@ 样本 1 

50 个 蓝 色 弹 珠 ，50 个 白色 弹 珠 。 

@ 样本 2 

50 个 白色 弹 珠 ，50 个 蓝 色 弹 珠 。 

现在 ， 想 象 一 个 更 加 可 能 的 情景 : 他 随机 抽取 的 弹 珠 ， 一 部 分 是 白色 的 ， 一 部 分 是 蓝 色 的 。 
比如 , 他 可 能 抽出 了 10 个 白色 弹 珠 和 40 个 蓝 色 弹 珠 , 然后 把 它们 放 入 第 二 个 杯子 。 在 这 种 情况 下 ， 
新 的 分 布 为 : 

@ 样本 1 

60 个 蓝 色 弹 珠 ，40 个 白色 弹 珠 。 

@ 样本 2 

60 个 白色 弹 珠 ，40 个 蓝 色 弹 珠 。 

按照 这 个 方法 ,尝试 你 想 要 的 任意 一 种 弹 珠 混合 方式 , 但 是 记 住 抽取 的 总 数 必须 是 50 个 (这 
是 为 了 复制 之 前 配 酒 的 情境 : 往 盛 有 威士忌 的 杯子 里 倒 回 1 盘 司 水 与 酒 的 混合 物 ， 即 杯 中 液体 的 
一 半 J 

注意 ， 无 论 你 尝试 哪 一 种 混合 方式 ， 最 后 的 结果 都 是 每 个 杯子 里 各 有 100 个 弹 珠 。 此 外 ， 最 
重要 的 是 , 注意 最 终 第 一 个 杯子 里 蓝 色 和 白色 弹 珠 的 比例 , 始终 等 于 第 二 个 杯子 里 白色 和 蓝 色 弹 
珠 的 比例 。 任何 不 在 第 二 个 杯子 里 的 蓝 色 弹 珠 必 在 第 一 个 杯子 里 , 任何 不 在 第 一 个 杯子 里 的 白色 
弹 珠 必 在 第 二 个 杯子 里 。 

对 于 威士忌 和 水 来 说 道理 也 是 一 样 。 正确 的 答案 是 它们 的 比例 一 定 相 同 , 不 管 最 初 是 怎么 混 


合 的 。 
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2.10.3 ”其 他 生效 领域 


现实 生活 中 的 民意 调查 公司 要 人 靠 预 测 选举 结果 的 准确 性 吃饭 和 维持 自身 名 声 , 它 们 同样 主要 关 
心 不 同 关键 类 别 里 每 一 类 样本 的 比例 。 如 果 只 有 两 个 候选 人 , 那么 刚刚 投 完 票 的 人 不 是 把 票 投 给 了 
候选 人 A， 就 是 投 给 了 候选 人 B， 即 没有 投 给 A 的 人 必定 投 给 了 B。 在 一 个 类 别 里 的 缺失 保证 了 在 另 
一 类 别 里 的 存在 。 以 百分比 的 形式 来 报告 预测 结果 带 来 了 提高 准确 性 的 可 能 , 但 同样 可 能 产生 更 大 
的 误差 ， 因 为 预测 一 个 选民 属于 A 类 ， 结 果 却 出 现在 B 类 ， 那 么 就 在 两 个 类 别 中 都 形成 了 误差 。 

当 社 会 科学 研究 统计 人 员 想 要 确定 他 们 的 样本 能 够 代表 总 体 时 , 他们 主要 关心 的 是 特征 在 样 
本 中 所 占 的 比例 ， 而 不 是 拥有 这 些 特征 的 人 数 。 最 重要 的 是 关键 研究 变量 上 ,样本 中 每 个 分 数 的 
比例 和 总 体 中 每 个 分 数 的 比例 相同 。 









































J 2.11 选择 可 靠 的 均值 
2 数据 驱动 的 决策 ， 比 如 判断 自己 在 新 城市 是 否 买 得 起 房 ， 或 者 在 生意 上 校准 核心 市 场 ， 
总 要 侯 赖 “均值 ”作为 对 大 数据 集约 最 好 描述 。 问 题 是 ， 有 三 种 完全 不 同 的 值 都 可 以 被 
称 作 “ 均 值 "“， 而且 它 们 人 往往 导致 不 同 的 决策 。 也 以 ,在 决策 中 要 注意 选用 正确 的 均值 。 


大 多 数 人 听 到 “这 个 镇 里 的 平均 房价 是 29 万 美元 ”( 你 可 能 觉得 这 一 价格 水 平 很 便宜 ， 也 可 
能 觉得 很 贵 或 者 适中 ,这 取决 于 你 在 哪个 地 方 安 家 )， 他 们 会 认为 这 个 数字 是 通过 加 总 镇 上 所 有 
房屋 的 销售 价 ， 再 除 以 房屋 总 数 而 算出 的 。 但 是 统计 学 家 知道 ,计算 “均值 ”的 方法 不 止 一 种 ， 
有 时 候 其 中 一 种 比 男 外 一 种 更 好 一 些 。 

29 万 美元 的 价格 是 否 真 正 代 表 了 典型 房价 , 取决 于 这 个 均值 究 竞 是 平均 数 、 中 位 数 还 是 众 数 。 
它 同样 取决 于 所 有 平均 数据 的 分 布 形状 。 聪明 人 会 确保 决策 中 使 用 的 是 最 佳 汇总 值 。 以 下 讨论 的 
是 每 种 均值 的 信任 场合 。 
































2.11.1 ” 趋 中 趋势 的 度量 


计算 一 组 值 的 均值 ,无论 它 们 具体 是 房价 、 期 末 考 试 分 数 ， 还 是 上 瑜伽 课 的 学 生 数 量 ， 目 的 
都 是 为 了 有 效 传达 这 些 值 的 趋 中 趋势 。 的 确 , 大 多 数 时 候 , 趋 中 趋势 是 通过 加 总 分 布 中 的 所 有 值 ， 
再 除 以 这 些 值 的 数量 之 和 确定 的 。 然 而 统计 学 上 并 不 把 这 个 称 作 均值 ， 而 是 称 作 平 均 数 。 那 么 ， 
为 什么 不 总 是 用 平均 数 来 计算 趋 中 趋势 呢 ? 因为 在 一 些 情 况 下 ， 平 均 数 不 能 代表 任何 真实 值 ! 


请 考虑 本 节 开 头 提 到 的 房屋 均 价 的 例子 。 假 设 你 收集 了 镇 上 300 所 房屋 的 数据 ， 想 要 计算 这 
个 样本 中 的 平均 售 价 。 一 般 来 说 ,平均 数 不 能 很 好 地 指示 房屋 价格 的 趋 中 趋势 。 原 因 见 图 2-5。 
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100- 29 万 美元 似乎 很 好 地 代表 了 
oo 房屋 售 价 的 总 中 趋 扫 













人 然而 这 些 房屋 销售 价格 的 平均 数 约 在 60 万 









































本 人 | 美元 左右 ， 在 我 们 现 有 由 300 所 房屋 组 成 的 样本 
We 中 ， 只 有 两 所 落 在 这 一 范围 内 

总 

由 ”40 











售 价 (以 10 万 美元 为 单位 ) 














图 2-5: 平均 数 对 均值 的 误导 

在 这 种 情况 下 , 平均 数 不 是 非常 可 靠 的 均值 ,因为 销售 价格 的 分 布 被 一 些 偏离 中 心 的 极 大 值 
所 和 契 曲 。 在 由 300 所 房屋 组 成 的 样本 里 ，231 所 房屋 的 售 价 介 于 10 万 美元 到 60 万 美元 之 间 。 剩 下 的 
69 所 房屋 ， 售 价 在 60 万 美元 以 上 ， 其 中 $6 所 超过 了 100 万 美元 。 平 均 数 受到 这 些 极 大 值 的 严重 影 
响 ， 因 此 无 法 代表 样本 中 的 任 一 房屋 


在 大 多 数 以 金钱 作为 变量 的 情况 下 , 都 不 太 适 合 以 平均 数 作为 均值 。 依 据 平均 数 报告 的 平均 
收入 指标 总 是 高 于 大 部 分 人 的 收入 水 平 。 因 为 总 有 少数 像 比 尔 盖 蒋 和 械 KK. 罗 琳 这 样 的 人 ,会 把 
平均 数 拉 高 。 

那么 ， 对 这 种 类 型 的 值 ， 什 么 才 是 “有 效 的 平均 ”? 对 于 类 似 图 2-5 中 的 分 布 ， 可 靠 的 统计 
学 家 倾向 于 报告 中 位 数 ， 而 不 是 平均 数 。 中 位 数 是 在 分 布 中 处 于 中 间 位 置 的 值 ， 即 整个 分 布 中 有 
一 半 的 值 低 于 它 ， 另 外 一 半 的 值 高 于 它 〈 就 好 比 高 速 公路 中 央 的 那 条 线 ， 把 路 面 分 成 两 半 )。 在 
这 个 例子 中 ， 数 据 分 布 的 中 位 数 恰 好 是 29 万 美元 ， 因 此 它 能 很 好 地 度量 趋 中 趋势 。 



























































2.11.2 ”选择 中 间 地 带 


中 位 数 在 这 些 情况 下 表现 不 错 ， 因 为 与 平均 数 相 比 ， 它 对 极端 值 的 敏感 性 要 低 得 多 ,因此 当 
分 布 是 正 偏 态 分 布 或 负 偏 态 分布 时 , 统计 人 员 更 倾向 于 采用 中 位 数 。 故 而 ， 当 分 布 被 一 些 远 远 小 
于 其 他 值 的 极端 值 所 看 曲 时 〈 如 图 2-6 所 示 ， 此 例 为 包括 50 个 学 生 测验 分 数 的 虚拟 集合 )， 中 位 数 
也 被 视 作 最 “有 效 ” 的 趋 中 趋势 度量 。 
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157 这 些 学 生 测验 成 绩 的 中 位 数 是 86 分 ， 
准确 代表 着 趋 中 趋势 
0 然而 由 于 10% 的 学 生 在 这 次 测验 
中 表现 极 差 ， 致 使 全 体 学 生 测验 成 绩 
呈 的 平均 数 只 有 70 分 ， 这 一 度量 仅 对 50 
3 名 学 生 当 中 的 一 名 具有 代表 性 
洲 





30 40 





60 
视 验 分 数 


50 











图 2-6: 中 位 数 是 对 趋 中 趋势 的 最 有 效 度量 


图 2-6 显 示 了 另外 一 种 类 型 的 数据 ， 





数 作为 度量 ， 可 以 对 班级 分 数 得 出 更 加 准确 的 解释 。 





2.11.3 ”不 适用 领域 




















但 是 ， 即 便 是 中 位 数 也 并 不 总 是 有 效 。 考 虑 下 面 这 种 情景 : 




















在 这 种 情况 下 使 用 平均 数 可 能 导致 错误 的 结论 。 以 中 位 


假设 你 是 一 名 瑜伽 教练 ， 你 班 里 一 


半 的 学 生年 龄 介 于 25 岁 至 35 岁 之 间 ,另外 一 半 介 于 50 岁 至 60 岁 之 间 。 你 会 怎么 描述 学 生 的 平均 年 龄 ? 


从 平均 数 还 是 中 位 数 都 无 法 恰当 描述 这 些 个 体 构成 的 群 组 。 那 
该 怎么 办 ? 在 这 种 情况 下 ， 最 有 效 的 均值 选择 是 报告 众 数 ， 也 就 是 在 数据 样本 中 出 现 最 多 的 值 ， 





如 图 2-7 所 示 。 


像 这 种 情况 下 的 问题 在 于 , 无 i 





























20 


但 这 一 组 


最 多 的 多 





这 些 学 生年 龄 





的 平均 数 和 中 位 数 均 为 42， 
F 的 任何 一 个 学 生 











这 无 法 代表 班 


中 出 现 次 数 
E 龄 值 为 30 岁 
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学 生年 龄 





另 一 组 中 
的 年 龄 值 为 54 岁 
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昌 现 次 数 最 多 


60 





图 2-7: 作为 最 有 效 均 值 的 众 数 





2.12 避 开 那 恶 坐标 轴 75 











在 这 种 情况 下 ， 有 两 个 众 数 : 一 个 是 30 岁 ， 另 外 一 个 是 54 岁 。 一 并 报告 这 两 个 数值 就 是 选择 
最 有 效 均值 的 最 佳 方式 。 对 于 这 种 类 型 的 数据 ， 平 均 数 和 中 位 数 都 会 形成 误导 。 





2.11.4 ”如何 选择 有 效 均值 


那么 , 什么 时 候 平 均 数 是 有 效 均 值 ? 基本 而 言 ， 当 只 有 一 个 众 数 并 且 呈 对 称 分 布 〈( 意味 着 两 
端 任意 一 个 方向 上 都 没有 明显 的 百 曲 ) 的 时 候 , 平均 数 是 最 佳 的 选择 。 如 果 你 瑜伽 班 上 的 学 员 都 
是 25 岁 到 35 岁 ， 那 么 平均 数 便 会 是 有 效 均值 。 

归根 到 底 , 应 当 如 何 选择 最 合适 的 均值 呢 ? 当 你 在 报告 汇总 值 的 时 候 , 遵循 下 面 三 条 简单 的 
原则 ,可 以 保证 均值 有 效 。 如 果 你 是 基于 这 些 数据 做 出 决策 的 人 ,遵循 这 三 条 原则 同样 会 让 你 作 
出 有 根据 的 选择 。 
口 如 果 数 据 中 存在 两 个 或 更 多 的 “趋势 ”( 即 两 块 或 两 块 以 上 高 频 值 区 域 )， 那 么 选择 众 数 ， 
并 报告 每 个 趋势 的 众 数 。 
口 如 果 分 布 是 偏 态 的 ( 即 一 小 部 分 极端 值 严重 影响 着 平均 数 )， 那 么 选择 中 位 数 。 
口 如 果 分 布 非常 对 称 ， 且 只 有 一 个 众 数 ， 那 么 选择 平均 数 。 

注意 在 大 多 数 情况 下 ,平均 数 、 中 位 数 和 众 数 三 者 会 非常 接近 ,这 很 有 趣 。 那 么 为 什么 要 采 
用 平均 数 呢 ? 平均 数 始 终 是 报告 均值 最 常用 的 方式 , 因为 如 果 我 们 想 要 获取 另外 一 个 样本 数据 并 
观察 其 趋 中 趋势 , 平均 数 更 易于 复制 。 中 位 数 和 众 数 的 可 变性 较 强 , 而 平均 数 则 比较 友好 和 稳定 。 

一 一 威廉 ， 斯 科 朗 普 斯 基 



























































en 2.12 ”和 避 开 邪恶 坐标 轴 
22 图 形 且 表现 数量 、 相 关 和 研究 结果 约 有 力 工具 。 但 是 ， 如 果 落 入 坏人 手中 ,图形 可 能 
被 用 于 炊 骗 目的。 选择 你 的 命运 ,年轻 的 卢 克 ( 站 者 年 轻 的 阿 纳 金 一 一 如 果 你 还 不 浊 

25 岁 的 旋 )，， 切 匆 谢 入 黑暗 面 。 


曾几何时 , 除了 科学 家 、 工 程 师 和 数学 家 以 外 没有 人 会 关注 图 表 。 然 而 随 着 越 来 越 多 的 新 闻 
媒体 瞄准 大 众 市 场 , 对 数字 信息 的 可 视 化 呈现 变 得 日 益 普遍 。 就 拿 昨 天 出 版 的 《今日 美国 》( US4 
Today ) 杂志 来 说 吧 ， 其 中 至 少 包 含 了 一 打 图 表 。 

在 商业 会 议 上 ， 也 经 常用 图 表 来 交流 信息 和 论证 所 取得 的 成 功 (或 失败 )。 如 果 创 建 图 表 时 
不 够 仔细 , 那么 ,一 些 看 似 随 意 的 选择 就 会 影响 对 信息 的 解释 。 你 无 需 改变 数据 ， 就 能 改变 数据 
的 含义 。 






































注 3: 天 行者 卢 克 和 天 行者 阿 纳 金 是 美国 科幻 电影 《星球 大 战 》 中 的 两 位 正面 人 物 。 一 一 译 者 注 
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所 以 , 在 创建 图 表 时 ， 如 果 你 想 避 免 操纵 受众 ， 或 者 只 想 指 出 某 个 带 有 误导 性 的 图 表 (不管 
这 种 误导 有 意 还 是 无 意 的 )， 那 么 不 妨 使 用 此 项 Hack 来 帮助 你 有 效 创 建 和 解释 图 表 。 

















2.12.1 选择 可 靠 的 图 表 
为 了 理解 正确 的 和 错误 的 绘图 选项 , 首先 需要 介绍 一 些 绘图 的 基础 知识 。 图 表 中 有 各 种 各 样 
的 元 素 ， 通 过 操纵 这 些 元 素 ， 可 以 正确 地 引导 他 人 ， 也 能 造成 误导 。 


典型 的 图 表 有 两 个 坐标 轴 ， 因 为 它们 描述 了 两 个 不 同 的 变量 。 治 着 底部 的 坐标 轴 称 作 X 镍 ， 
而 治 着 侧 边 的 轴 叫 做 Z。 

















可 以 这 么 记 : 垂直 的 那个 坐标 轴 叫 做 7 轴 ， 因为 这 个 可 爱 的 小 字母 7 仿佛 向 上 伸展 着 
小 手 ， 重 直 地 指向 天 空 。 明 白 了 吗 ? (欢迎 来 到 充满 创意 的 统计 学 教育 领域 。) 

















哪 种 图 表 适 合 ( 真实 地 ) 展示 你 测量 的 变量 ,取决 于 变量 的 测量 标准 [Hack #7]。 你 可 以 从 三 
种 常见 的 图 表 类 型 中 做 出 选择 ， 其 中 只 有 一 种 适用 于 你 所 测量 的 变量 。 

e 条 形 图 

在 图 2-8 中 ，X 轴 表示 类 别 或 组 别 ， 比 如 男性 和 女性 。7 轴 是 连续 变量 : 条 形 高 度 越 高 ， 变 量 了 
的 分 值 就 越 高 。 
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图 2-8: 条 形 图 

e@ 柱状 图 

在 图 2-9 中 ，X 轴 表示 连续 的 值 。 柱 状 图 总 是 运用 于 以 下 情况 : X 轴 表示 反映 内 在 连续 变量 的 
普通 类 别 ， 比 如 一 年 中 的 月 份 , 或 者 其 他 可 进行 有 意义 排序 的 差异 性 分 组 。 它 和 条 形 图 看 起 来 相 
似 ， 只 不 过 那些 条 形 被 挤 到 一 起 ， 相 互 间 没有 留 下 空间 。 
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图 2-9: 柱状 图 

e@ 折线 图 

在 图 2-10 中 ,X 轴 和 7 轴 都 是 连续 变量 ,在 这 个 例子 中 ,它们 分 别 表示 时 间 和 价值 。 线 上 的 点 
位 置 越 高 ， 它 在 7 轴 上 的 数量 就 越 大 。 
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图 2-10: 折线 图 

为 了 选择 正确 的 图 表 ( 即 其 样式 具有 最 小 欺骗 性 和 最 大 直观 性 的 图 表 )， 需 要 正确 认定 你 在 
使 用 哪 种 类 型 的 X 变 量 (注意 ,7 在 所 有 的 样式 中 都 是 连续 变量 )。 
口 如 果 X 代 表 不 同类 别 ， 而 7 代表 连续 变量 ， 使 用 条 形 图 。 
口 如 果 X 可 被 看 作 分 类 变量 , 但 是 其 次 序 仍 有 一 定 的 意义 ， 而 7 是 连续 变量 ,使 用 柱状 图 。 
口 如 果 X 有 和 7 都 是 连续 变量 ， 使 用 折线 图 。 


2.12.2 图形 暴力 
绘图 中 的 一 个 常见 错误 ， 通 常 与 X 轴 的 尺度 设置 有 关 ， 这 也 许 是 有 意 的 ， 也 许 是 无 心 之 失 。 
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接 下 来 ， 让 我 告诉 你 这 个 问题 的 原因 ， 以 及 如 何 避 免 它 。 

包含 两 个 变量 的 图 表 引 入 了 对 比 一 一 它们 或 者 是 变量 之 间 的 对 比 ， 或 者 是 时 间 跨 度 的 对 比 ， 
或 者 是 一 个 变量 上 不 同 值 的 对 比 。 一 图 胜 千 言 ,就 像 人 们 常 说 的 那样 ,图 表 是 非常 具有 说 服 力 的 
证 据 。 无 论 何 时 ， 当 你 使 用 折线 图 或 是 条 形 图 来 对 比 数值 时 ， 只 有 当 线 的 高 度 或 条 形 的 长 度 是 依 
据 某 个 标准 的 最 小 值 来 得 出 判断 ， 对 比 结果 才 是 准确 的 。 这 一 最 小 值 通常 是 零 。 如 有 果 图 表 没 有 依 
据 某 些 合理 的 基准 值 加 以 校准 ， 那 么 实际 上 极其 细微 的 差异 在 图 中 就 会 显得 很 大 。 

例如 ， 对 比 图 2-11 中 的 两 张 图 。 它 们 所 表示 的 数据 完全 一 样 , 但 是 你 对 二 者 的 解释 可 能 差异 
极 大 。 左上 角 的 柱状 图 反映 了 美国 股票 市 场 在 过 去 5 天 的 表现 。 注意 在 第 5 天 出 现 了 一 个 看 上 去 非 
常 忒 怖 的 下 跌 。 毫 无 疑问 ,惊天动地 的 消息 在 第 4 天 未 就 出 现 了 。 你 也 许 同 样 注意 到 2 ( 道琼斯 
指数 ) 的 起 点 不 是 零 ， 而 是 9900， 一 个 低 到 足以 包含 所 有 5 个 条 形 顶 部 的 值 ， 但 那样 是 没有 意 
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图 2-11: Y 轴 的 威力 
让 我 们 更 仔细 地 看 看 图 2-11 中 下 方 的 第 二 张 




















图 。 两 张 








图 展示 的 数据 是 一 样 的 , 但 是 第 二 张 图 








的 起 点 是 9。 这 张 图 里 展示 的 数据 可 解读 为 ， 股 市 在 过 去 5 天 出 现 了 小 幅 波 动 ， 第 5 天 的 可 怕 下 跌 


只 是 暂时 


人 


生 的 小 问题 。 








这 两 张 图 哪个 展示 了 正确 的 情形 ? 二 者 都 反映 了 从 第 4 天 到 第 5 天 股票 市 场 有 2.8% 的 下 跌 。 究 
竞选 择 哪 一 种 ,实际 上 有 赖 于 图 表 构 建 者 的 意图 及 其 目标 受众 是 谁 。 当 涉及 数字 或 是 金钱 时 , 通 
常 并 没有 一 个 最 有 意义 和 最 公平 的 起 点 。 很 多 报纸 提供 的 每 日 股票 信息 采用 第 一 张 柱状 图 的 格 
式 。 他 们 认为 读者 对 细微 的 变动 感 兴趣 ， 所 以 将 7 轴 的 起 点 值 设置 得 尽 可 能 高 ， 以 能 够 包含 在 X 


轴 上 的 所 有 数据 为 底线 。 
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但 是 , 在 一 个 经 常 改变 投资 组 合 , 并 且 频 繁 买卖 的 贪 禁 的 投资 者 看 来 ,2.8% 的 下 跌 是 很 严重 
的 事情 。 对 于 这 一 类 读者 而 言 ， 能 够 突出 显示 细微 变动 的 图 表 设 计 也 许 最 为 有 效 。 然 而 ， 如 果 一 
名 投资 者 抱 着 “长 期 持 有 ”的 投资 战略 ， 那 么 相对 微小 的 改变 是 没有 意义 的 。 

为 了 尽 可 能 多 地 了 解 这 类 图 表 中 包含 的 意义 ,需要 经 常 检查 7 轴 的 起 始 值 。 这 样 ， 当 你 查看 
图 中 那些 条 柱 的 时 候 ， 就 能 感觉 到 X 轴 上 的 真正 差异 。 如 果 你 正在 绘制 这 样 的 图 表 ， 不 妨 想 一 想 
用 哪 种 方式 展示 信息 最 为 可 靠 。 因 为 你 的 目的 是 如 实 传递 信息 ,而 不 是 欺骗 一 一 应 该 是 这 样 吧 ? 



































2.12.3 参阅 


《统计 数字 会 撒谎 》( How to Lie With Statistics ， 作 者 达 莱 尔 : 哈 夫 ，1954 年 纽约 ，Norton and 
Company ),， 该 书 首次 向 公众 指出 了 图 表 的 骗 人 花招 ， 尤 其 是 广告 里 的 图 表 。 








第 3 章 


测量 世界 
( Hack #23~#34 ) 





赋予 现象 以 数量 ,对 理解 现象 有 很 大 的 价值 。 虽然 有 时 候 将 概念 转换 为 数字 的 过 程 中 , 会 丢 
失 一 些 重要 的 信息 , 但 是 通过 创建 分 数 来 代表 任何 我 们 感 兴趣 的 事物 ， 能够 使 理解 更 为 精确 ， 同 
样 也 使 对 比 成 为 可 能 。 这 些 Hack 全 都 是 关于 分 数 测量 以 及 分 数 解释 的 。 

整个 Hack 家 族 都 依赖 于 正 态 分 布 [Hack #23]， 而 正 态 分 布 无 处 不 在 。 有 了 正 态 曲线 ， 你 能 够 
知道 和 其 他 人 相 比 你 自己 所 处 的 位 置 [Hack #4]， 能 够 在 测试 前 预知 可 能 的 测试 表现 [Hack #25]， 
以 及 深度 理解 你 的 测试 成 绩 [Hack 吉 6 和 Hack #27]。 

说 到 测试 ， 你 将 学 到 如 何 编制 一 套 好 的 问题 [Hack #8] 并 进行 一 场 高 质量 的 测试 [Hack #31 和 
Hack #32]。 你 能 辨别 出 糟糕 的 题 项 、 无 意义 的 问题 ， 能 够 在 不 知道 答案 的 情况 下 作出 良好 的 测 
试 表现 [Hack #29]。 你 还 能 够 在 不 研读 书本 的 情况 下 ， 提 高 测试 成 绩 [Hack #30]。 

最 后 , 通过 学 习 一 系列 坚实 的 测量 原理 ,你 能 够 计算 一 个 时 代 、 一 个 人 或 一 项 事业 的 生命 周 
期 [Hack #33]， 并 学 会 使 用 可 能 延长 寿命 的 医疗 信息 [Hack #34]。 

测量 又 测量 ， 本 章 内 容 全 是 关于 测量 的 Hack。 


TB 3.1 看 万 物 的 形状 
, 了 让 自然 界 沁 插 所 有 的 事物 都 从 相同 的 方式 分 布 。 只 要 你 能 够 测量 事物 ， 不管 它 是 什么 ， 
和 允许 分 若 变 化 的 情况 下 ， 它 就 有 一 个 明确 清楚 的 “ 正 臣 分 布 “。 如 果 你 知道 这 种 正 芒 
曲线 的 形状 甸 节 ， 就 能 对 其 表现 作出 非常 准确 的 预测 。 


统计 领域 里 有 一 些 奇迹 。 至少 有 三 种 工具 (或 三 种 发 现 ) 是 如 此 绝妙 和 神奇 ， 以 至 于 只 要 统 
计 学 的 学 生 学 到 并 开始 理解 它们 的 美 ， 就 会 变 得 无 比 激动 。 
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好 吧 ， 我 可 能 有 点 夸大 事实 ， 但 是 的 确 有 三 种 极 好 的 理解 世界 的 工具 : 
口 相关 系数 [Hack #11]; 
口 中 心 极限 定理 [Hack #2]; 
口 正 态 曲线 。 

因为 我 们 已 经 在 其 他 Hack 中 讨论 了 前 两 个 奇迹 的 使 用 , 现在 我 们 把 时 间 花 在 理解 第 三 个 ( 正 
态 曲 线 ) 奇迹 的 形状 和 用 法 上 。 我 很 乐意 展示 这 个 能 表现 整个 世界 的 正 态 曲线 、 正 态 分 布 、 钟 形 
曲线 ， 如 图 3-1 所 示 。 


























分 数 





图 3-1: 正 态 曲线 
3.1.1 ”应 用 正 态 曲线 下 的 区 域 


统计 学 家 已 经 非常 详尽 地 定义 了 正 态 曲线 。 使 用 微 积 分 和 现实 世界 几 百 年 的 数据 收集 
方法 可 以 发 现 ， 它 们 在 关于 正 态 分 布 的 确切 形状 上 得 到 的 结论 完全 相同 。 图 3-2 展 示 了 正 
的 重要 特征 。 平 均 数 在 中 间 ， 越 偏离 中 心 ， 分 数 的 空间 越 小 。 
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图 3-2: 正 态 曲线 下 的 区 域 



































82 


第 3 章 测量 世界 ( Hack #23~#34 ) 





测量 
偶然 
随 着 


原 旺 
ITDY 
小 
数 ， 








虽然 理论 上 正 态 曲线 是 无 限 宽 的 ， 但 是 平均 数 左 右 两 侧 的 各 三 个 标准 差 足以 涵盖 所 有 分 数 。 





肛 分 布 的 标准 差 是 每 个 分 数 离 平均 数 的 平均 距离 [Hack #2]。 


1. 预测 测试 成 绩 

回想 我 之 前 作出 的 论断 : 你 测量 的 任何 事物 都 呈现 为 正 态 曲线 。 那 么 , 言 外 之 意 就 是 , 我 们 
的 任何 事物 的 大 部 分 分 数 靠近 平均 数 ， 只 有 少 部 分 分 数 远离 平均 数 。 测量 足够 多 的 人 ,你 会 
获得 非常 远离 平均 数 的 极端 分 数 ， 但 是 这 种 分 数 非常 罕见 。 获 得 特定 分 数 的 人 群 期 望 比例 ， 
分 数 远离 平均 数 而 变 得 越 来 越 小 。 

那么 你 参加 的 下 个 测试 会 有 怎样 的 成 绩 呢 ? 我 不 知道 有 关 测 试 或 是 有 关 你 的 任何 信息 , 但 我 
打赌 说 你 会 获得 一 个 接近 平均 数 的 分 数 。 你 也 许 会 获得 高 于 平均 数 的 分 数 或 低 于 平均 数 的 分 
但 是 正 态 曲 线 告 诉 我 ， 你 的 分 数 可 能 会 非常 接近 平均 数 。 

为 了 作出 这 类 预测 并 对 预测 的 准确 性 有 十 足 的 把 握 , 你 可 以 用 已 知 的 正 态 曲 线 来 估计 分 数落 


























入 X 轴 上 ( 图 表 的 底部 ， 水 平 部 分 ) 任意 两 点 间 的 百分比 。 刻 度 上 配对 标准 差点 之 间 的 分 数 百 分 


比 ， 
部 分 


的 给 


如 图 3-2 所 示 。 百 分 比 总 和 是 100%， 这 是 由 于 凑 整 导致 的 。 记 住 ， 有 些 分 数 ， 虽 然 只 有 一 小 
， 但 和 平均 数 的 距离 超过 三 个 标准 差 。 

下 面 是 有 关 曲 线 的 几 个 重要 事实 ， 你 能 够 利用 这 些 事实 去 预测 表现 。 

口 大 约 34% 的 分 数落 人 平均 数 至 平均 数 上 方 一 个 标准 差 内 。 看 到 图 3-2 中 的 阴影 部 分 了 吗 ? 如 
果 你 拿 一 些 墨 水 给 正 态 曲线 下 方 的 整个 区 域 上 色 ， 那 你 会 在 这 块 区 域 消耗 掉 34% 的 墨水 。 
口 大 约 34% 的 分 数落 入 平均 数 至 平均 数 下 方 一 个 标准 差 内 。 

口 大 约 14% 的 分 数落 入 平均 数 上 方 的 一 个 标准 差 至 两 个 标准 差 范 围 内 。 

口 大 约 2% 的 分 数落 入 平均 数 下 方 两 个 标准 差 至 三 个 标准 差 范围 内 。 

你 同样 可 以 组 合 这 些 百分比 作出 以 下 陈述 ， 比 如 : 

口 大 约 68% 的 分 数 在 平均 数 正 负 一 个 标准 差 范 围 内 ; 

口 大 约 50% 的 分 数落 人 平均 数 下 方 。 

你 能 用 这 些 已 知 的 百分比 去 做 预测 和 概率 解释 。 我 们 可 以 这 么 描述 正 态 曲线 : 分 数落 入 曲线 
定 区 域 的 百分比 ， 也 可 以 说 任意 给 定 的 测试 参与 者 落 入 给 定 区 域 的 可 能 性 。 

口 下 一 次 测试 中 ， 有 2% 的 几率 ， 你 会 得 到 高 于 平均 数 两 个 标准 差 的 分 数 。 

口 在 我 们 的 职业 技能 测试 中 , 测试 申请 人 仅 有 16% 的 几率 会 得 到 低 于 平均 数 一 个 标准 差 的 分 数 。 
2. 设 定 标 准 

政策 制定 者 划分 表现 水 平等 级 时 , 依赖 于 这 样 一 个 假设 : 能 力 是 正 态 分 布 的 。 他 们 选择 有 这 
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样 表现 水 平 的 人 : 有 一 定 百分比 能 够 胜任 该 工作 。 在 制订 录取 政策 或 服务 标准 时 ， 如果 想 奇迹 般 
地 提前 知道 会 有 多 少 人 符合 要 求 ， 正 态 分 布 是 一 个 非常 宝贵 的 工具 。 

比如 ,一 所 拥有 高 学 术 水 准 的 大 学 , 也 许 要 求 考生 在 一 项 能 力 测试 中 , 分数 至 少 高 于 平均 数 
一 个 标准 差 。 这 样 的 话 ， 他 们 就 确保 只 招收 能 力 在 前 16% 的 人 。 

同样 地 , 美国 特殊 教育 政策 规定 了 学 生 在 特殊 教育 状况 资格 测试 ( 因此 ,是 联邦 政府 和 州 拨 
款 ) 上 的 分 割 分 数 (cut score )。 分割 分 数 是 一 个 人 必须 高 于 (或 低 于 ) 的 特定 分 数 。 假 设 政策 制 
定 者 只 支付 为 2% 的 儿童 设立 的 特殊 教育 项 目 和 教员 的 预算 ， 那 他 们 会 把 分 割 分 数 设 在 平均 数 之 
下 两 个 标准 差 处 。 对 正 态 曲线 的 信任 ,使 得 他 们 能 够 计算 出 需要 拨款 的 儿童 数量 。 

















3.1.2 ”体会 正 态 曲 线 之 美 


为 了 体会 正 态 分 布 的 神奇 , 你 可 以 经 常 建立 自己 的 正 态 曲线 。 想 象 你 测量 了 某 件 事物 ( 比如 
态度 、 知 识 、 身 高 或 速度 )。 你 有 某 个 评分 系统 ， 分 数 允 许 变化 〈 比如 态度 调查 分 数 、SAT 分 数 、 
英寸 或 每 小 时 英里 数 )。 因 为 你 测量 了 很 多 人 、 很 多 建筑 物 或 很 多 麻雀， 所 以 你 有 很 多 的 分 数 。 
现在 ， 把 这 些 分 数 放 到 一 张 图 上 ， 图 中 X 轴 表示 从 最 低 到 最 高 的 实际 分 数值 ， 从 左 到 右 (或 是 从 
右 到 左 ， 如 果 你 喜欢 的 话 ); 7 轴 ( 左 侧 垂直 部 分 ) 代表 分 数 群 中 每 个 值 的 相对 频次 。 

在 这 样 一 个 图 表 中 ， 线 或 点 的 高 度 代表 特定 值 分 数 的 相对 比例 。 注 意 : 在 正 态 曲 线 上 ， 最 高 
点 位 于 中 间 ， 最 低 点 位 于 两 端 。 中 间 的 分 数 是 平均 分 ,也 是 最 大 众 的 分 数 。 在 正 态 曲线 上 ， 中 位 
数 等 于 平均 数 ， 也 等 于 众 数 [Hack #21]。 

同样 要 注意 ， 正 态 曲 线 是 对 称 的 : 你 可 以 将 正 态 曲线 对 折 ， 它 的 一 边 会 完美 地 覆盖 另 一 边 。 
需要 着 重 提 及 的 正 态 曲 线 的 另 一 个 特征 是 : 正 态 曲线 是 向 两 端 无 限 延伸 的 。 它 是 一 条 理论 上 的 曲 
线 ， 所 以 曲线 的 两 端 永远 不 会 碰 到 底线 。 

正 态 曲 线 是 联系 自然 万 物 的 普遍 真理 。 它 是 完美 平衡 的 。 它 是 永恒 的 。 它 是 不 朽 的 。 它 看 起 
来 有 点 像 一 只 铠 龙 ， 非 常 酷 。 







































































4 3.2 ”计算 百 分 位 
7 全 理解 测试 届 绩 的 一 个 简单 而 有 效 的 请 法 是 使 用 百 分 等 级 。 下 面 讲解 如 何 获 取 几 乎 没有 
解释 价值 的 原 妖 分数， 并 将 其 转换 得 更 具 信 息 量 和 价值 。 


在 学 校 里 , 教师 (或 是 顾问 ,或 是 任何 报告 标准 测试 结果 的 人 ) 或 许 向 你 报告 过 结果 , 但 从 
未 报告 过 你 的 分 数 。 取 而 代 之 的 是 , 你 可 能 看 到 一 个 看 起 来 像 百 分 比 的 数字 ,这 个 数字 用 来 描述 
和 其 他 参加 测试 的 人 相 比 ， 你 (或 你 的 孩子 ) 的 表现 如 何 。 这 种 类 型 的 分 数 称 作 百 分 等 级 。 


如 果 你 得 到 了 一 个 代表 自己 测试 表现 的 百 分 等 级 , 那么 只 有 在 你 知道 其 含义 的 情况 下 ,这 个 
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百 分 等 级 才 是 有 用 的 。 另 一 方面 ,如果 你 必须 向 参加 测试 的 人 员 解 释 其 测试 成 绩 , 而 你 仅仅 展示 
了 一 个 原始 分 数 , 那么 这 种 展示 是 没有 意义 的 。 建 立 或 解释 百 分 等 级 是 一 项 对 测试 双方 ( 参加 测 
试 的 人 和 解释 测试 成 绩 的 人 ) 都 非常 有 用 的 技能 。 

常 模 参照 计 分 [Hack #6] 是 一 种 通过 和 其 他 分 数 进行 对 比 ， 使 测试 分 数 更 具 信 息 量 的 一 种 方 
法 。 在 现实 世界 里 , 你 最 常见 到 的 常 模 参照 分 数 是 百 分 等 级 。 百 分 等 级 被 定义 为 “分 布 中 低 于 给 
定 分 数 的 分 数 的 百分比 ”。 比 如 ， 在 一 项 有 20 道 题 的 小 测试 中 ， 如 果 你 答对 了 15 道 题 ， 班 里 有 一 
半 的 人 答对 的 题 数 没 你 多 ， 那 你 的 百 分 等 级 就 是 50。 
3.2.1 计算 和 报告 百 分 等 级 

如 果 你 是 一 名 任课 教师 或 人 力 资 源 经 理 , 或 任何 必须 向 其 他 人 报告 测试 结果 的 人 , 报告 百 分 
等 级 而 非 原始 分 数 能够 帮助 参加 测试 的 人 员 理解 他 们 的 表现 , 同样 也 能 够 帮助 决策 者 理解 设 定 不 
同 表现 标准 的 重要 性 。 

1. 整理 你 的 数据 

计算 百 分 位 首先 要 整理 你 所 有 的 测试 分 数 。 对 于 小 数据 集合 ， 建 立 一 个 频次 表 非 常 简单 ， 这 
个 频次 表 除 了 能 提供 百 分 等 级 ， 还 能 回答 各 种 问题 。 

下 面 是 一 个 课堂 测试 中 30 个 分 数 的 样本 分 布 ( 由 最 低 到 最 高 排列 )，100 分 是 最 高 分 : 

S59、 65、72、75、75、7S、80、83、83、85S、85S、85S、85S、8S、85S、86、86、86、86、88、 

88、88、90、90、90、90、90、92、94、97 

2. 计算 频次 和 百 分 位 

为 高 效 起 见 ， 可 按 表 3-1 展 示 这 些 数据 ， 并 计算 每 个 分 数 的 频次 。 
表 3-1: 课堂 测试 累计 频次 表 







































































分 数 频次 累计 频次 百分比 累计 百分比 
59 1 1 3.33% 3.33% 
65 1 2 3.33% 6.67% 
72 1 3 3.33% 10.00% 
73 3 6 10.00% 20.00% 
80 1 3.33% 23.33% 
83 2 9 6.67% 30.00% 
85 6 隔 20.00% 50.00% 
86 4 19 13.33% 63.33% 
88 3 22 10.00% 73.33% 
90 27 16.67% 90.00% 
92 1 28 3.33% 93.33% 
94 1 29 3.33% 96.67% 
97 1 30 3.33% 100.00% 
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表 3-1 展 示 了 参加 测试 的 人 获得 了 哪些 分 数 ， 有 多 少 人 获得 了 那个 分 数 ， 获 得 给 定 分 数 的 总 
人 数 ， 获 得 分 数 低 于 给 定 分 数 的 总 人 数 ， 获 得 某 个 分 数 的 人 数 占 所 有 人 数 的 百分比 ， 获 得 不 高 于 
给 定 分 数 的 人 数 的 总 百分比 。 累计 频次 列 总 是 报告 出 分 布 中 的 ( 在 我 们 例子 中 是 30 人 ) 总 人 数 (或 
分 数 )， 以 及 人 数 总 的 百分比 ( 总 是 100% )。 

3. 计算 百 分 等 级 

为 了 计算 分 布 中 任意 分 数 的 百 分 等 级 ， 需 要 使 用 “累计 百分比 ”一 列 。 找 到 感 兴趣 的 分 数 ， 
查看 其 所 在 行 的 上 一 行 对 应 的 累计 百分比 。 比 如 ， 对 于 94 分 来 说 ， 百 分 等 级 是 93.33 ， 大 约 是 第 
93 个 百 分 位 。86 分 的 百 分 等 级 是 50。 






























































”” 如果 你 查看 一 系列 统计 学 或 测量 学 教材 ， 会 发 现 ， 对 于 百 分 等 级 来 说 ， 实 际 上 存在 
刀 两 种 不 同 的 、 有 争议 的 定义 。 我 更 喜欢 “分 布 中 小 于 感 兴趣 的 给 定 分 数 的 分 数 百 分 
比 ”这 个 定义 ， 但 是 有 些 书 给 出 的 定义 是 “分 布 中 等 于 或 小 于 感 兴趣 的 给 定 分 数 的 

分 数 百分比 "。 两 个 定义 都 是 合理 的 ， 且 在 这 两 种 定义 下 都 可 以 通过 频次 表 来 计算 百 

分 等 级 。 在 第 一 个 定义 下 ， 不 存在 第 100 个 百 分 位 。 在 第 二 个 定义 下 ， 不 存在 第 0 个 

百 分 位 。 选 择 并 使 用 你 偏爱 的 定义 ,但 记 住 ， 在 呈现 结果 时 要 和 大 家 分 享 你 的 定义 。 


3.2.2 ”解释 百 分 等 级 


想象 一 下 你 对 面 坐 着 你 的 指导 顾问 ,你 被 告知 自己 的 百 分 等 级 是 93 。 那 么 ,这 代表 什么 意思 ? 
好 吧 ， 最 直接 的 解释 是 : 在 所 有 参加 测试 的 人 中 ， 有 93% 的 人 得 到 的 分 数 比 你 低 。 这 么 说 同样 
是 正确 的 : 有 7% 的 人 分 数 和 你 一 样 或 高 于 你 。 我 们 同样 能 够 把 百 分 等 级 看 做 分 数 偏离 常态 的 
离 。 平 均 百 分 等 级 总 是 在 第 50 个 百 分 位 附近 ， 如 果 分 数 是 正 态 分 布 ， 那么 平均 百 分 等 级 正好 就 
第 50 个 百 分 位 。 所 以 ,我 们 同样 可 以 说 第 93 个 百 分 位 远 远 高 于 平均 百 分 等 级 。 

不 要 犯 很 多 精明 的 统计 黑客 有 时 也 会 犯 的 错误 。 本 Hack 前 半 部 分 , 我 们 使 用 了 一 个 测试 分 数 
的 例子 , 你 在 一 项 有 20 道 题 的 小 测试 上 答对 了 15 道 题 , 班 里 有 一 半 的 人 答对 的 题 数 没 你 多 。 在 这 
个 例子 中 ， 你 的 百 分 等 级 是 50。 注 意 ， 此 例 中 ， 你 答题 的 正确 率 是 75% ( 15/20 ), 但 是 百 分 等 级 
是 50。 不 要 把 这 两 个 概念 搞 混 了 ! 你 的 百 分 等 级 无 法 说 明 你 究竟 答对 了 多 少 道 题 。 
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3.2.3 不 适用 领域 


记 住 ， 只 有 在 你 寻求 常 模 参照 解释 时 ， 百 分 等 级 才 是 有 用 的 。 如 果 你 想 知道 自己 是 否 掌握 了 
一 系列 关键 技能 ， 那 么 知道 有 多 少 百分比 的 人 已 经 掌握 了 多 于 或 少 于 这 些 的 技能 是 毫 无 帮助 的 。 
为 了 知道 和 某 套 标准 相 比 你 所 处 的 位 置 , 而 不 是 和 其 他 人 相 比 你 所 处 的 位 置 , 你 需要 一 个 标准 参 
照 分 数 [Hack #26]。 在 这 种 情况 下 ， 正 确 率 这 一 类 型 的 分 数 比 百 分 等 级 更 有 意义 。 
































86 第 3 章 测量 世界 (Hack #3~#34) 





3.2.4 ”参阅 





如 果 假 定 你 的 分 数 是 正 态 分 布 的 , 或 者 说 至 少 来 自 于 正 态 分 布 的 总 体 , 你 刚好 能 利用 正 态 曲 
线 下 方 区 域 的 信息 将 标准 分 数 直接 转换 成 百 分 等 级 [Hack #25]。 








| 3°3 利用 正 态 曲线 预测 未 来 
4 在 自 汰 界 中 ， 我 们 测量 的 几乎 所 有 事物 都 有 一 个 已 知 的 分 布 形状 ， 即 “ 正 蕊 曲线， 
所 以 我 们 能 够 利用 这 个 分 布 的 精确 细节 来 预测 未 来， 并 回答 各 种 概率 问题 。 


本 书 中 ,很 多 Hack # 都 充分 利用 了 统计 学 家 和 正 态 曲 线 的 密切 关系 。“ 看 万 物 的 形状 ”[Hack 
#23] 展 示 了 使 用 正 态 曲 线 预 测 测试 表现 的 大 体 方法 。 但 是 ， 我 们 能 够 做 得 更 好 。 

我 们 掌握 了 如 此 多 的 关于 这 条 神奇 曲线 准确 形状 的 信息 , 以 至 于 能 对 分 数落 在 某 个 范围 内 的 
概率 作出 准确 预测 。 可 以 提出 很 多 和 测试 表现 相关 的 其 他 类 型 的 问题 , 统计 学 能 在 我 们 参加 测试 
前 就 帮助 我 们 解答 ! 比如 : 

口 你 的 分 数落 在 任意 给 定 两 个 分 数 之 间 的 几率 是 多 少 ? 

口 有 多 少 人 的 得 分 介 于 这 两 个 分 数 之 间 ? 

口 你 通过 下 次 测试 的 几率 是 多 少 ? 

口 你 会 被 哈佛 大 学 录取 吗 ? 

口 在 美国 有 多 少 百分比 的 学 生 能 够 成 为 国家 优秀 奖学金 获得 者 ( National Merit Scholar ) ? 
口 我 叔叔 弗兰克 通过 门 撒 资 格 测试 (Mensa qualifying exam ) 的 几率 是 多 少 ? 


回答 这 种 类 型 的 问题 ， 需要 一 个 精确 的 工具 。 本 Hack 提 供 了 所 需 的 工具 : 正 态 曲线 下 方 区 域 
的 表格 。 


















































3.3.1 正 态 曲线 下 方 区 域 的 表格 

正 态 曲线 由 分 布 的 平均 数 和 标准 差 来 定义 , 不 管 我 们 测量 什么 , 只 要 计 分 系统 容许 分 数 产 生 
变化 , 那么 曲线 的 形状 就 总 是 相同 的 。 落 入 曲线 下 方 不 同 区 域 的 分 数 所 占 比 例 已 经 被 明确 规定 好 
了 ， 比 如 不 同 标准 差 之 间 的 空间 以 及 距 平均 数 的 距离 。 

这 个 Hack 依 赖 于 一 张 看 起 来 有 些 复 杂 的 表格 , 但 这 张 表格 富 含 如 此 多 的 有 用 信息 , 以 至 于 它 
会 很 快 成 为 你 黑客 工具 箱 中 的 一 个 主要 的 工具 。 事 不 宜 迟 ， 让 我 们 深呼吸 ， 来 看 看 表 3-2。 
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表 3-2: 正 态 曲线 的 下 方 区 域 





Zz 分数 平均 数 和 z 分 数 之 间 分 数 的 比例 大 区 域 中 分 数 的 比例 小 区 域 中 分 数 的 比例 
0.00 0.00 0.50 0.50 
0.12 0.05 0.55 0.45 
0.25 0.10 0.60 0.40 
0.39 0.15 0.65 0.35 
0.52 0.20 0.70 0.30 
0.67 0.25 0.75 0.25 
0.84 0.30 0.80 0.20 
1.04 0.35 0.85 0.15 
1.28 0.40 0.90 0.10 
1.65 0.45 0.95 0.05 
1.96 0.475 0.975 0.025 
4.00 0.50 1.00 0.00 


3.3.2 ”解密 表格 


在 使 用 这 个 极 好 的 工具 前 , 我 们 需要 再 次 深呼吸 , 然后 了 解 一 下 情况 。 我 已 经 用 好 几 种 方式 
简化 了 这 张 表 的 信息 。 首 先 ， 我 只 列举 了 一 些 能 计算 出 数值 的 信息 ， 并 没有 列 出 全 部 。 事 实 上 ， 
很 多 统计 学 书 以 0.01 为 增长 速率 ， 列 出 了 0.00~4.00 的 z 分 表 数 。 那 样 会 展示 很 多 信息 ， 此 处 我 们 
截取 最 常用 的 一 部 分 信息 , 包括 达到 90% 置 信 区 间 ( 1.65 ) 所 需 的 z 分 数 , 以 及 95% 置 信 区 间 (1.96 ) 
的 z 分 数 。 想 知道 更 多 关于 置信 区 间 的 信息 ， 可 参考 “精确 测量 ”[Hack #6]。 

我 把 比例 四 舍 五 入 至 小 数 点 后 两 位 。 最 后 ， 我 在 表格 中 用 z 符 号 以 标准 差 的 形式 表示 和 平均 
数 之 间 的 距离 。 你 能 在 “给 原始 分 数 改 头 换 面 ”[Hack #26] 中 ， 学 到 更 多 有 关 z 分 数 的 知识 。 

理解 了 对 表格 所 做 的 简化 后 , 可 以 使 用 它 对 表现 进行 概率 预测 或 回答 统计 问题 , 第 一 步 就 是 
理解 第 4 列 的 含义 。 

@ 7z 列 

描绘 正 态 曲线 [Hack #3]。 你 可 能 对 某 个 可 能 落 入 底部 水 平 线 的 分 数 感 兴 趣 ， 而 它 与 平均 数 
也 有 一 定 距离 。 它 可 能 比 平均 数 大 也 可 能 比 平均 数 小 。 用 标准 差 表示 与 平均 数 的 距离 就 是 z 分 数 。 
z 分 数 为 1.04， 描 述 的 是 距离 平均 数 1.04 个 标准 差 的 分 数 。 因 为 正 态 曲线 是 对 称 的 ， 故 而 我 们 不 用 
在 意 距 离 的 正 负 ， 所 以 展示 出 来 的 z 分 数 都 是 正 值 。 

@ 平均 数 和 z 分 数 之 间 分 数 的 比例 

在 平均 数 和 一 个 给 定 分 数 的 空间 内 , 存在 某 个 比例 的 分 数 。 这 是 一 个 随机 分 数落 入 由 平均 数 
和 任意 z 分 数 所 限定 区 域 的 概率 。 
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@ 大 区 域 中 分 数 的 比例 

你 同样 能 够 描述 任意 给 定 z 分 数 和 z 分 数 为 4.00 之 间 的 区 域 ， 或 者 说 是 曲线 的 末端 。 

理论 上 ， 曲 线 不 会 真正 终止 ， 但 z 分 数 为 4.00 已 经 非常 接近 涵盖 100% 的 分 数 。 

但 是 ， 曲 线 有 两 个 末端 。 除 非 z 分 数 为 0.0， 否 则 z 分 数 和 曲线 一 端的 距离 一 定 大 于 z 分 数 和 曲 
线 另 一 端的 距离 。 这 一 列 指 的 是 z 分 数 和 曲线 最 远 端的 区 域 ， 这 一 列 的 值 是 落 入 这 个 区 域 分 数 的 
比例 。 换 句 话 说 ， 是 一 个 随机 个 体会 在 这 个 区 域 获得 分 数 的 几率 。 

@ 小 区 域 中 分 数 的 比例 

这 列 指 的 是 z 分 数 和 曲线 最 近 端 的 区 域 。 它 表示 沙 人 这 个 区 域 分 数 的 比例 。 






































3.3.3 ”估计 得 分 高 于 或 低 于 任意 分 数 的 几率 


如 果 你 想 知道 被 大 学 录取 的 几率 , 就 要 明确 你 需 达 到 的 分 数 , 这 个 分 数 在 学 校 入 学 测试 中 也 
被 称 作 分 割 分 数 ( cut score )。 只 要 你 知道 了 这 个 分 数 , 就 能 找 出 这 个 测试 的 平均 数 和 标准 差 。( 所 
有 这 些 信息 可 能 都 在 网 上 。) 将 你 的 原始 分 数 转换 成 z 分 数 [Hack #6]， 然 后 在 表 3-2 中 找到 那个 z 
分 数 ， 或 是 接近 z 分 数 的 分 数 。 

判断 分 割 分 数 是 否 高 于 平均 数 。 

口 如 果 分 割 分 数 高 于 平均 数 ， 查 看 “小 区 域 中 分 数 的 比例 ” 列 。 那 代表 你 获得 等 于 或 高 于 

分 割 分 数 的 几率 ， 以 及 你 被 录取 的 几率 。 

口 如 果 分 割 分 数 低 于 平均 分 (这 不 太 可 能 ， 只 是 为 了 完整 地 训练 你 如 何 使 用 这 个 工具 )， 查 
看 “大 区 域 中 分 数 的 比例 ” 列 。 那 代表 被 录取 的 学 生 比 例 ， 若 其 他 因素 等 同 ， 也 代表 你 
被 录取 的 几率 。 

确定 得 分 低 于 一 个 给 定 分 数 的 几率 时 ， 步 又 和 上 述 提 到 的 选择 相反 。 分 割 分 数 低 于 平均 数 ， 
获得 低 于 特定 分 割 分 数 的 几率 在 “小 区 域 ” 列 。 分 割 分 数 高 于 平均 数 , 则 获得 低 于 给 定 分 割 分 数 
的 几率 在 “大 区 域 ” 列 。 



































3.3.4 估计 得 分 介 于 任意 两 个 分 数 之 间 的 几率 

要 想 知 道 获得 一 个 介 于 某 个 计 分 分 数 ( scoringscore ) 范围 内 的 分 数 的 几率 ,可 以 通过 查看 正 
常 落 入 那个 范围 的 分 数 比例 来 计算 。 

如 果 你 想 要 知道 有 多 少 比例 的 分 数落 入 曲线 下 方 任 意 两 个 点 的 分 数 之 间 ， 那 么 通过 z 分 数 来 
定义 这 些 点 ， 并 计算 相关 比例。 根据 两 个 分 数 是 否 落 在 平均 数 的 同一 侧 ， 可 利用 下 述 方法 计算 介 
于 这 些 点 之 间 的 分 数 的 正确 比例 。 
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口 如 果 z 分 数 在 曲线 的 同一 侧 ， 查 看 “大 区 域 ” 列 或 查看 “小 区 域 ” 列 ， 得 到 两 个 z 分 数 ， 然 
后 用 高 值 减 去 底 值 。 

口 如 果 一 个 z 分 数落 在 平均 数 左 侧 ， 另 一 个 z 分 数落 在 平均 数 右 侧 ， 平 均 数 在 这 两 个 z 分 数 中 
间 , 那么 使 用 "平均 数 和 z 分 数 之 间 分 数 的 比例 ” 列 。 查 看 两 个 z 分 数值 , 然后 将 它们 相 加 。 








3.3.5 “计算 百 分 等 级 

这 张 表格 的 第 三 种 用 途 是 计算 百 分 等 级 。 你 可 以 在 “计算 百 分 位 ”[Hack #4] 中 读 到 更 多 关 
于 常 模 参 照 的 内 容 。 对 于 高 于 平均 数 的 分 数 ， 百 分 等 级 是 “平均 数 和 z 分 数 之 间 分 数 的 比例 ”加 
上 0.50。 对 于 低 于 平均 数 的 分 数 ， 百 分 等 级 是 “小 区 域 中 的 分 数 比 例 ”。 














3.3.6 ”判断 统计 显著 性 
这 种 表格 的 另 一 种 用 途 是 确定 分 数 差异 的 统计 显著 性 [Hack #4]。 通过 确定 落 入 分 数 之 间 某 个 
距离 或 更 远 距离 的 分 数 比 例 ， 你 能 计算 出 那个 结果 的 统计 概率 。 


更 有 用 的 是 ， 其 他 的 统计 值 ， 比 如 相关 系数 和 比例 也 能 被 转换 成 ?分数 ， 这 张 表 同样 可 以 用 
来 将 这 些 值 和 0 对 比 ， 或 者 进行 相互 对 比 。 























3.3.7 ”生效 原理 


“看 万 物 的 形状 ”[Hack 雹 3] 提 供 了 对 正 态 曲线 的 很 好 概览 。 但 是 ， 仅 通过 在 表 3-2 中 查看 这 
些 值 的 改变 方式 ， 你 就 能 感觉 到 正 态 分 布 的 形状 。 平 均 数 附近 ， 每 行 有 着 较 小 的 z 分 数 ， 但 有 很 
大 比例 的 分 数落 入 。 随 着 向 远离 平均 数 的 方向 移动 , 若 要 包含 相同 比例 的 分 数 就 需要 越 来 越 大 的 
曲线 区 域 。 


比如 ，z 分 数 从 1.65 猛 增 到 4， 只 覆盖 了 分 布 的 后 5%。 但 是 ,在 平均 数 附近 ，z 分 数 只 需 从 0.12 
增加 到 0.25， 就 能 铸 盖 分 数 的 53%。 这 张 表格 证 明了 常见 的 有 多 常见 ， 军 见 的 有 多 罕见 。 











3.3.8 ”参阅 


你 可 以 利用 如 下 网 址 来 计算 自己 的 正 态 曲线 下 的 准确 区 域 : http://www.psychstat.missouristate. 
edu/introbook/sbk11m.htm。 这 个 网 站 由 大 卫 : 斯 托 克 伯 格 (David Stockburger ) 维护 ， 里 面 有 很 
好 的 讨论 和 交互 式 的 计算 需 。 当 你 访问 此 网 站 时 ,不 要 被 Mu 和 Sigma 这 两 个 词 弄 糊涂 了 , 它们 是 
分 别 代 表 平 均 数 和 标准 差 的 统计 术语 。 
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J 3.4 给 原始 分 数 改头换面 
LP 测试 的 原 妈 分 数 意义 不 大 甚至 没有 意义 。 但 是 ,将 可 怜 的 原 九 分 数 转 化 评 “z 分 数 ” 
后， 你 几 入 从 以 相信 有 多 少 信息 被 塞 进 了 这 个 小 小 的 超级 数字 里 。 


那个 直接 获得 且 显 而 易 见 的 原始 分 数 比如 高 中 测试 分 数 )， 传 达 的 信息 量 非常 少 ， 这 令 人 
震惊 。 比 如 下 面 的 例子 。 如 果 我 从 学 校 回 家 告诉 妈妈 我 今天 在 学 校 的 一 项 重要 测试 中 得 了 16 分 ， 
她 可 能 会 说 些 什么 ， 比 如 “你 42 岁 了 ， 为 什么 还 住 在 我 家 里 ? ”以 及 “不 错 ， 亲 爱 的 。16 分 算 好 
的 吗 ? ” 

当 你 只 是 告诉 某 人 一 个 原始 分 数 时 ,被 分 享 的 真实 信息 非常 少 。 你 不 知道 16 是 否 算 一 个 不 错 
的 成 绩 。 你 也 不 知道 16 是 相对 高 还 是 相对 低 的 分 数 。 有 很 多 人 得 到 16 分 甚至 更 高 的 分 数 吗 ?还 是 
很 多 人 获得 了 低 于 16 的 分 数 ? 即便 我 们 知道 测试 分 数 的 分 布 范围 和 所 有 可 能 的 分 数 等 信息 , 也 依 
然 无 法 将 这 次 测试 的 分 数 表现 和 过 去 测试 或 下 次 测试 的 分 数 表现 进行 对 比 , 也 不 能 和 其 他 学 科 的 
分 数 对 比 。 原 始 分 数 实际 上 是 没有 意义 的 。 

不 要 烦恼 ! 你 依然 能 够 知道 你 以 及 其 他 人 的 表现 。 你 依然 能 够 作出 选择 ， 并 透 过 人 和 测试 进 
行 表现 比较 。 依 然 有 希望 

原始 分 数 可 以 被 转变 成 一 个 能 做 所 有 事情 的 新 分 数 , 那 是 97 磅 这 种 无 能 的 原始 分 数 永远 都 做 
不 了 的 。 原 始 分 数 能 被 转换 成 一 个 超级 数字 : z 分 数 。 不 像 原 始 分 数 ，z 分 数 会 告诉 你 ， 你 的 表现 
是 高 于 还 是 低 于 平均 水 平 ， 并且 会 告诉 你 高 于 或 低 于 平均 水 平 的 程度 。z 分 数 还 能 使 你 进行 不 同 
测试 和 事件 的 对 比 ， 甚 至 对 比 不 同 的 人 。 
























































3.4.1 计算 z 分 数 


可 以 通过 一 种 方式 将 原始 分 数 转换 为 ?分 数 ， 那 么 新 的 数字 表示 原始 分 数 高 于 或 低 于 平均 数 
的 程度 。 

















下 面 是 公式 
。_ 原始 分 数 -平均 数 
标准 其 
为 了 将 原始 分 数 转换 成 ?分 数 ， 先 用 原始 分 数 减 去 平均 数 ， 然 后 除 以 标准 差 。 分 布 的 标准 关 


是 每 个 分 数 和 平均 数 距离 的 平均 [Hack #2]。 


3.4.2 理解 表现 
z 分 数 的 值 通常 介 于 -3 至 3 之 间 。 仔 细 检 查 方程 式 顶 部 ， 你 也 许 会 注意 到 以 下 内 容 : 
口 如 果 原 始 分 数 比 平均 数 大 ， 那 么 z 分 数 为 正 ; 
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口 如 果 原 始 分 数 比 平均 数 小 ， 那 么 z 分 数 为 负 ; 
口 如 果 原 始 分 数 正 好 等 于 平均 数 ， 那 么 z 分 数 为 0。 





2 分数 的 值 往往 介 于 -3 至 3 之 间 ， 因 为 分 数 的 正 态 分 布 通常 刚好 是 6 个 标准 差 的 宽度 
[Hack #23]。 





明智 的 测量 专业 人 员 在 报告 结果 时 会 使 用 z 分 数 技巧 。 你 看 到 的 全 都 是 基于 z 分 数 的 分 数 ， 通 
常 称 为 标准 分 数 [Hack 可 7]， 而 不 是 原始 分 数 。 这 些 标准 分 数 有 已 知 的 稳定 特征 。 因 此 ， 如 果 你 
知道 这 些 分 数 的 特征 ( 它们 的 平均 数 和 标准 差 )， 就 能 将 它们 转换 回 z 分 数 ， 知 道 和 其 他 人 相 比 你 
的 表现 如 何 。 

为 了 说 明 如 何 使 用 这 个 法 则 来 揭示 有 关 你 表现 的 隐藏 信息 , 我 们 以 ACT 测试 为 例 。 美 国 很 多 
高 中 生 都 参加 美国 大 学 人 学 考试 (The American College Test )， 很 多 大 学 也 将 其 作为 录取 条 件 。 
ACT 是 一 项 成 就 和 能 力 测 试 ， 被 认为 能 够 预测 学 生 在 大 学 的 表现 。 
测试 的 每 部 分 的 分 数 范 围 都 是 1 至 36。 虽 然 在 过 去 几 十 年 里 ， 实 际 的 测试 描述 性 统计 发 生 了 
波动 ( 因为 分 数 有 提高 ), 但 官方 报告 的 ACT 平均 数 总 是 为 18, 标准 差 为 6。 想 象 3 个 学 生 参 加 ACT 
测试 ， 得 到 3 个 不 同 的 分 数 。 我 们 可 以 用 ACT 分 数 分 布 的 平均 数 和 标准 差 将 这 3 个 分 数 转换 成 z 分 
数 ， 如 表 3-3 所 示 。 


表 3-3: 将 原始 分 数 转换 成 z 分 数 


























学 生 ACT 分 数  《 (原始 分 数 -平均 数 ) 标 准 差 《和 “ 萎 数 | 
扎 克 14 (14-18J/6=-4/6 -0.67 
泰勒 18 (18-18)/6=0/6 0.00 
艾 萨 克 24 (24-18)/6=6/6 1.00 


扎 殉 的 z 分 数 是 负 的 ， 所 以 我 们 知道 他 的 得 分 低 于 平均 水 平 。 他 的 得 分 低 于 平均 数 大 概 2/3 个 
标准 差 。 泰勒 的 z 分 数 是 0.00, 表示 和 过 去 这 些 年 参加 ACT 的 其 他 人 相 比 , 他 的 表现 处 于 平均 水 平 。 
艾 萨 克 做 得 最 好 ， 得 到 高 于 平均 数 1 个 标准 差 的 分 数 。 





每 年 举行 测试 的 时 候 ， 实 际 的 ACT 平均 数 和 标准 差 都 会 改变 。 过 去 几 年 真正 的 平均 
数 和 标准 差 大 约 是 21 和 4.5。 


3.4.3 ”确认 你 表现 的 稀有 性 


昌 然 知道 和 其 他 参加 测试 的 人 相 比 你 的 得 分 情况 ， 比 只 知道 一 个 原始 分 数 更 有 用 ， 但 z 分 数 
真正 的 解释 力 来 自 于 它 和 正 态 曲 线 的 关系 。 图 3-3 是 一 张 正 态 分 布 图 ， 和 “看 万 物 的 形状 ”[Hack 
#23] 里 展示 的 图 相似 。 
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“看 万 物 的 形状 ” [Hack #23] 里 展示 的 图 和 这 个 图 的 差异 在 于 : 图 3-3 将 这 些 值 作为 z 分 数 展示 ， 
而 不 是 展示 每 个 标准 差 离 平 均 数 的 距离 。 通 过 使 用 正 态 曲线 下 区 域 的 知识 ， 你 甚至 能 从 z 分 数 中 
学 到 更 多 的 知识 。 如 果 分 数 是 正 态 分 布 的 , 那么 你 可 以 就 分 数 在 某 个 区 间 出 现 的 概率 这 一 话题 侃 
侃 而 谈 了 。 


























标准 差 














z=1.00 z=2.00 





z= 3.00 








2% 14% 34% 34% 14% 2% 





z=-3.00 z=-2.00 z=-1.00 平均 数 

















图 3-3: z 分 数 和 正 态 曲线 


表 3-3 中 展示 的 分 数 同样 能 被 解释 为 相 比 这 名 学 生 ， 表 现 更 好 或 更 差 的 学 生 人 数 。 泰 勒 的 z 分 
数 为 0.00， 这 意味 着 他 的 表现 比 50% 的 学 生 要 好 。 同 样 能 够 将 学 生 的 分 数 表述 成 概率 。 如 泰勒 有 
50% 的 几率 会 得 到 0.00 或 更 好 的 z 分 数 。 在 任意 测试 中 , 学 生 只 有 16% 的 几率 能 得 到 1.00 或 更 高 的 z 
分 数 ， 所 以 相 比 其 他 参加 测试 的 人 来 说 ， 艾 萨 克 做 得 很 好 。 








3.4.4 生效 原理 


将 原始 分 数 转换 成 z 分 数 后 ， 我 们 就 能 和 其 他 人 进行 对 比 了 ， 你 可 能 觉得 这 是 合理 的 ， 其 实 
不 止 你 一 个 人 这 样 认为 。 在 过 去 的 关于 教育 测量 领域 的 100 年 里 ， 社 会 学 家 ( 以 及 任何 必须 评估 
人 类 表现 的 人 ) 一 直 被 常 模 参 照 ( norm-referenced ) 解释 的 简洁 性 吸引 。 即 使 不 确定 测试 分 数 的 
真正 含义 , 我 们 至 少 能 将 你 的 分 数 和 其 他 人 的 情况 做 对 比 。 不 管 我 们 测量 的 是 什么 , 我 们 至 少 能 
够 知道 你 所 拥有 的 比 其 他 人 更 多 还 是 更 少 。 

另 一 种 用 来 解释 教育 和 心理 分 数 的 方法 是 标准 参照 ( criterion-referenced )。 这 种 方法 需要 知 
道 更 多 的 有 关 我 们 已 测量 的 特质 或 内 容 的 信息 , 并 且 在 事前 就 要 确定 需要 多 少 信息 量 。 标 准 参 照 
测量 使 得 每 个 人 都 能 获得 同样 的 分 数 ， 只 要 他 们 满足 同样 的 标准 。 前 一 种 方法 ( 常 模 参 照 ) 以 前 
是 并 且 一 直 是 最 受 欢迎 的 解释 方法 ， 而 后 一 种 方法 〈 标 准 参照 ) 才刚 刚 起 步 。 
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Ta 3.5 标准 分 数 
1 令 人 居 证 的 是 ， 所 有 这 些 知名 的 、 利 益 估 关 的 考试 ， 比 如 SAT、ACT 以 及 竹 商 测试 ， 
从 来 都 不 报告 你 的 原 妖 分 数 。 相 反 ， 测 访 报 告 已 经 将 那个 无 用 的 数字 转换 成 了 一 个 
下 有 意义 的 分 数 ， 这 个 分 数 可 用 来 和 其 他 参加 同样 测试 的 人 进行 对 比 ， 从 而 知晓 你 
的 表现 如 何 。 一 旦 你 理解 了 “标准 ′” 分 ， 就 能 自己 计算 标准 分 ， 基 至 创建 自己 的 标 


准 分 。 


“给 原始 分 数 改 头 换 面 ”[Hack #6] 讨 论 了 z 分 数 的 超 能 力 。 这 些 标准 分 数 给 无 意义 的 原始 分 
数 添加 了 各 种 各 样 的 信息 。 有 一 点 非常 好 ， 那 就 是 任何 使 用 这 本 书 的 人 都 能 解释 z 分 数 ， 并 基于 
分 数 的 解释 信息 作出 决策 。 

但 是 ， 当 你 想 解读 很 多 分 数 报告 ( 比如 你 刚 获得 的 SAT 分 数 ) 时 ， 却 发 现在 任何 地 方 都 不 会 
看 到 z 分 数 ， 相 反 ， 你 看 到 的 是 一 些 奇 怪 的 自 定义 标准 分 。 这 种 自 定义 的 标准 分 只 有 报告 分 数 的 
相应 公司 才 使 用 , 它 有 点 像 z 分 数 但 是 和 2 分数 有 差异 , 这 种 差异 足以 让 新 手感 到 分 数 是 无 意义 的 。 

不 要 害怕 。 你 可 以 利用 下 面 的 工具 解释 这 些 奇 怪 的 标准 分 数 ， 其 至 创建 自己 的 标准 分 数 ( 当 
你 向 其 他 人 报告 你 那 奇怪 的 测试 ,而 这 项 测试 席卷 全 国 时 , 你 会 像 ACT 先 生 或 IQ 小 姐 以 及 任何 依 
靠 测 试 赚钱 的 人 一 样 富有 )。 






































3.5.1 Zz 分 数 的 问题 


可 以 确定 的 是 ， 当 向 参加 测试 的 人 或 他 们 的 父母 、 大 学 和 正 考 虑 使 用 z 分 数 的 雇主 汇报 时 ，z 
分 数 存 在 某 种 缺陷 阻碍 了 它 的 广泛 使 用 。 但 另 一 方面 , 大 多 数 测试 公司 在 创建 一 个 更 有 吸引 力 的 
标准 分 时 ， 首 先 使 用 的 是 z 分 数 ， 随 后 才 报告 更 有 吸引 力 的 标准 分 。 
使 用 下 面 这 个 公式 将 原始 分 数 转换 成 z 分 数 : 
-原始 分 数 -平均 数 
标准 差 
正如 “给 原始 分 数 改 头 换 面 ”[Hack #26] 里 详细 描述 的 一 样 ， 这 个 公式 计算 出 的 z 分 数 往往 在 
一 3.00~+3.00, 平均 数 是 0.00， 标 准 差 是 1。 虽 然 z 分 数 作 为 解释 测试 分 数 的 工具 非常 有 用 , 但 人 们 
看 到 它 时 ， 仍 会 由 于 一 些 原因 不 喜欢 这 些 数字 。 
口 它 可 以 是 负 值 。 事 实 上 ， 有 一 半 的 z 分 数 是 负 值 。 你 很 难说 服 参 加 测试 的 人 相信 和 负 分 不 是 
坏 消 息 。 
口 0.00 分 是 平均 分 ! 如 果 我 无 法 向 人 们 解释 负 分 不 一 定 是 件 坏事 ,想象 一 下 ， 尝 试 说 服 父母 
说 我 们 期 望 小 比 利 在 那个 重大 测试 中 得 到 0 分 ， 当 他 的 确 得 了 0 分 时 我 们 很 高 兴 (将 会 多 
么 困难 )。 
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口 你 能 预期 的 最 高 分 是 3.00, 并 且 在 100 个 参加 测试 的 人 里 只 有 1 个 人 能 得 到 那个 分 数 。 如 此 
一 来 ， 即 使 在 测试 准备 时 付出 相当 大 的 努力 ， 看 起 来 也 只 是 为 了 获得 微不足道 的 3 分 ! 
测量 人 员 已 经 探索 和 发 现 了 报告 测试 分 数 的 其 他 标准 尺度 , 这 些 标 准 尺度 有 着 更 令 人 满意 的 
属性 。 诀 窍 是 从 计算 z 分 数 开 始 ， 然 后 将 其 转换 到 某 个 其 他 更 友好 的 平均 数 和 标准 差 的 尺度 上 。 



































3.5.2 ”创建 和 解释 T 分 数 

z 分 数 的 一 个 问题 是 : 平均 数 是 0。 把 0 分 当做 一 件 好 事 来 报告 ， 会 使 得 一 些 教师 、 父 母 和 学 
生 因 误解 而 不 高 兴 。 我 们 可 以 通过 在 字母 表 里 把 z 移 动 到 7 的 方法 解决 这 个 问题 。 

7 分 数 是 对 z 分 数 的 转换 。 转 换 后 新 分 布 的 平均 数 是 50， 标 准 差 是 10。7 分 数 方程 式 使 用 了 后 
向 转换 方法 。 下 面 是 7 分 数 的 计算 公式 ; 


















































T=z (10) +50 

所 以 , 如 果 小 比 利 在 一 项 重大 测试 上 的 得 分 是 平均 分 , 那 他 得 到 了 0.00 的 z 分 数 , 不 要 给 他 的 
父母 报告 这 个 吓人 的 分 数 ， 而 是 把 它 转换 成 7 分 数 : 

7=0.00(10)+50 7=0.00+50 7=50 

报告 比 利 得 到 了 50 分 。 茶 喜 ! 为 了 使 分 数 更 有 意义 ,一 名 好 的 教师 或 者 学 校 顾问 会 解释 说 7 
分 数 得 范围 是 20 至 80， 其 中 50 分 是 平均 分 。 

在 一 些 测试 报告 中 ， 相 对 z 分 数 来 说 ，7 分 数 是 个 更 好 的 备 选 方案 。7 分 数 不 会 是 负 值 , 平均 
数 也 是 看 起 来 比较 可 观 的 50 分 。 





















































”明尼苏达 多 项 人 格 问卷 了 (Multiphase Personality Inventory-II ) 是 一 项 非常 流行 的 、 
| 
MMPI- 开 子 量 表 的 平均 分 都 是 50， 标 准 差 是 10。 通 过 把 每 个 子 量 表 的 分 数 放 到 同一 
个 尺度 上 ， 你 能 够 进行 特质 间 的 横向 对 比 ， 并 能 建立 一 个 分 数 概况 (profile )， 从 而 

更 全 面 地 了 解 参 试 人 员 。 


3.5.3 创建 自 定义 的 标准 分 数 


测试 开发 人 员 已 经 找到 了 其 他 报告 标准 分 的 方式 。 表 3-4 列 出 了 很 多 知名 的 、 利 益 依 关 的 测 
试 ， 很 多 人 参加 过 或 将 会 参加 这 些 测试 。 
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表 3-4: 常见 的 标准 分 数 分 布 


























测试 名 称 典型 分 数 范 围 平均 数 标准 差 
z 分 数 -3.00~3.00 0 1 
7 分 数 20~80 50 10 
美国 大 学 测试 (ACT ) 1~36 18 6 
SAT 200~800 500 100 
美国 研究 生 入 学 考试 ( GRE ) 200~800 500 100 
研究 生 管理 科 入 学 考试 (GMAT ) 200~800 500 100 
法 学 院 人 学 考试 (LAST ) 120~180 150 10 
医学 院 人 学 考试 ( MCAT ) 1~15 8 2.5 
韦 氏 智力 量 表 (IQ 测试 ) 55~145 100 15 
斯 坦 福 比 纳 智力 测试 (1Q 测 试 ) 52~148 100 16 

















因为 测试 分 数 是 正 态 分 布 的 , 所 以 你 可 以 把 任意 分 数 放 在 正 态 曲 线 上 来 解读 , 从 而 看 出 你 的 
表现 是 否 处 于 平均 位 置 ， 是 否 出 奇 地 低 或 高 [Hack #23]。 





3.5.4 创建 自己 的 标准 分 

为 了 好 玩 , 你 可 以 按照 自己 的 意愿 ， 以 任意 平均 数 和 标准 差 来 创建 自己 的 标准 分 。 难 道 你 不 
希望 自己 的 SAT 分 数 是 350 分 ?选择 一 个 分 布 范 围 ， 然 后 进行 分 数 转 换 吧 。 

比如 说 ， 你 偏爱 这 样 一 个 分 布 : 平均 数 是 752 365， 标准 差 是 216 456。( 谁 不 会 ? ) 我 们 把 这 
个 分 布 称 作 Frey 分 数 分 布 。 套 用 7 分 数 规则 ， 你 能 够 把 350 分 的 SAT 分 数 转换 成 Frey 分 数 。 记 住 ， 
你 必须 首先 将 350 分 的 SAT 分 数 转化 为 z 分 数 : 























,原始 分 数 -平均 数 _ 350-500 _-150__| 50 
标注 差 100 100 
然后 将 它 转换 成 Frey 分 数 。 
Frey=-1.50 x 216 456+752 365=-324 684+752 365=427 681 
现在 ，427 681 分 是 不 是 比 350 分 听 起 来 要 好 ? 因为 你 知道 Frey 分 布 的 平均 数 ， 所 以 对 两 个 分 
数 的 解释 是 相同 的 : 它们 依然 在 平均 分 之 下 ， 它 们 依然 在 平均 数 1.5 个 标准 差 下 。 实 际 上 ， 你 没 
有 改变 它 ， 只 是 改变 了 用 来 描述 它 的 数字 。 

















3.5.5 生效 原理 
































2 分 数 的 分 布 为 : 平均 数 是 0， 标 准 差 是 1。 这 是 由 我 们 使 用 的 公式 决定 的 。 用 一 组 值 除 以 它 
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们 的 标准 差 后 ， 新 分 布 的 标准 差 是 1。 用 分 布 中 的 每 个 分 数 减 去 平均 数 ， 生 成 的 新 值 分 布 在 平均 
数 0 的 附近 。 

如 果 我 们 希望 使 用 的 分 数 有 我 们 自己 选择 的 独特 的 平均 数 和 标准 差 ， 可 以 对 每 个 z 分 数 进行 
反 转 处 理 ， 用 任何 我 们 偏好 的 值 奉 代 平 均 数 0 和 标准 差 1。 








3.5.6 ”理解 常 模 参照 计 分 

我 们 已 经 从 统计 学 角度 讨论 了 和 常 模 参 照 计 分 的 内 在 特点 和 直观 吸引 力 , 但 它 不 是 产生 有 意义 
分 数 的 唯一 方法 ， 也 不 总 是 最 佳 方法 。 

正如 “给 原始 分 数 改头换面 ”[Hack #6] 中 讨论 的 一 样 ， 当 你 设计 计 分 系统 并 建构 测试 时 ， 
实际 上 有 两 种 原理 可 供 选 择 。 

@ 常 模 参 照 计 分 

驱动 原理 : 为 了 更 好 地 理解 任务 表现 ( 比如 参 演 一 部 电影 或 是 参加 ACT 测 试 )， 应 该 对 比 某 
个 人 和 其 他 人 的 表现 水 平 。 

@ 标准 参照 计 分 

基于 一 系列 标准 来 评估 表现 ， 比 如 知识 库 、 一 套 技能 、 教 育 性 目标 和 诊断 特征 。 

如 果 你 认为 常 模 参 照 方法 是 合理 的 , 那么 你 就 会 想 用 这 里 介绍 的 工具 来 解释 自己 在 这 些 常见 
标准 测试 上 的 表现 。 


























| J 3.6 正确 提问 
如 果 你 是 一 名 任课 教师 、 一 位 面试 官 ， 吉 处 于 任何 想 要 测量 他 人 理解 力 的 情境 下 ， 居 
么 你 有 多 种 提问 方法 。 下 面 是 一 些 测量 学 工具 ,能 让 你 以 正确 的 方式 提出 恰当 的 问题 。 
一 百 多 年 来 ,课堂 一 直 是 充满 问题 和 答案 的 地 方 。 除 了 学 校 , 测试 在 工作 和 招聘 中 也 越 来 越 
常见 。 甚 至 业余 时 间 当 我 在 聚会 上 遇见 他 人 时 ， 如 果 不 回答 我 是 “友好 ”还 是 “冷漠 ”的 关系 小 
测试 ， 我 都 无 法 举 起 一 杯 Cosmo 鸡 尾 酒 。( 我 是 冷漠 的 ， 想 用 它 做 点 什么 吗 ? ) 
很 多 教授 必须 提出 好 的 问题 或 编写 出 好 的 测试 : 
口 教师 在 授课 或 一 对 一 教学 中 会 对 学 生 提 问 ， 以 此 评估 学 生 的 理解 程度 ; 
口 培训 师 编写 问题 来 评估 研讨 会 的 效果 ; 
口 人 事 部 主任 开发 标准 问题 来 测量 应 聘 者 的 技能 。 
评估 他 人 的 学 识 时 ， 几 乎 所 有 人 都 会 面临 这 样 的 困境 : 问 哪 种 类 型 的 问题 能 真正 切中 要 害 。 
当 编 写 测 试 或 设计 问题 来 测量 知识 或 理解 程度 时 , 会 遇 到 两 个 最 常见 的 问题 , 而 本 Hack 提 供 了 解 
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决 方案 。 


口 如 何 构 建 一 个 好 问题 ? 
口 应 该 问 什么 ? 





3.6.1 构建 一 个 好 问题 








为 了 快速 且 高 效 地 测量 知识 ， 很 难 避 免 把 选择 题 作 为 一 种 问题 形式 。 








多 选 题 Multiple-choice question ) 是 一 种 给 回答 者 提供 问题 或 指导 语 (叫做 题 干 )， 
刀 然后 让 他 们 选 出 正确 答案 或 是 从 一 系列 答案 选项 中 作出 选择 的 题目 。 这 种 类 型 的 题 
目 要 求人 们 选择 ( select ) 答案 ， 所 以 有 时 候 也 被 称 作 选项 (selection item )。 
为 了 更 规范 准确 地 编写 好 的 选择 题 项 ， 我 们 使 用 下 面 的 例子 快速 入 门 。 


这 是 一 个 选择 题 的 例子 : 








谁 写 了 《了 不 起 的 盖 茨 比 》 选 项 





A. 福 克 纳 干扰 项 ， 
B. 非 英杰 拉 德 正确 答案 ( 参考 答案 ) ? 
C .海明威 干扰 项 
D. 斯 坦 贝克 干扰 项 * 





如 你 所 见 ， 这 个 问题 的 每 个 选项 都 有 一 个 名 字 。 正确 的 答案 称 作 正确 答案 ( 那 怎么 能 算 科学 


术语 呢 )， 错 误 的 答案 称 作 干 扰 项 。 








对 选择 题 项 的 特征 以 及 如 何 编 好 题 项 的 研究 并 不 是 很 多 , 但 有 一 些 实证 研究 。 为 了 编写 出 好 








的 选择 题 项 ， 要 遵循 下 面 这 些 通过 研究 得 出 的 关键 项 目 编写 指导 原则 。 





@ 包含 3~5 个 选项 


题目 应 该 有 足够 量 的 答案 选项 ,这 样 使 猜测 答案 变 得 困难 。 但 选项 不 能 太 多 ,否则 会 使 干扰 


项 看 起 来 不 可 信 或 占用 太 多 答题 时 间 。 


@ 不 要 将 “以 上 所 有 选项 ”作为 选项 
有 些 人 会 猜测 此 种 选项 为 正确 答案 , 并 将 其 作为 应 试 策略 的 一 部 分 。 而 其 他 人 会 避免 这 种 策 





注 1: 
注 2: 
注 3: 
注 4: 


Faulkner，1897 一 1962， 美 国 小 说 家 ， 曾 获 1949 年 诺 贝尔 文学 奖 。 一 一 译 者 注 
Francis Scott Key Fitzgerald，1896 一 1940， 美 国 小 说 家 。 译 者 注 
Ernest Hemingway，1899 一 1961， 美 国 小 说 家 ， 曾 获 1954 年 诺 贝 尔 文学 奖 。 一 一 译 者 注 
John Ernest Steinbeck，1902 一 1968， 美 国 作 家 ， 曾 获 1962 年 诺 贝尔 文学 奖 。 一 一 译 者 注 
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略 。 不 管 哪 种 方式 ， 作 为 一 个 干扰 项 ， 这 样 操作 都 是 不 合理 的 。 而 且 , 评估 “以 上 所 有 选项 ”是 
和 否 为 正确 答案 需要 应 试 者 的 分 析 能 力 ， 而 不 同 应 试 者 的 此 种 分 析 能 力也 是 各 异 的 。 此 外 , 测量 这 
种 特殊 的 分 析 能 力 可 能 并 不 是 测试 的 目标 。 

@ 不 要 将 “以 上 选项 都 不 是 ”作为 选项 


这 个 指导 原则 的 存在 原因 和 上 一 个 指导 原则 一 样 。 此 外 ， 出 于 某 个 原因 , 教师 们 的 确 往往 把 
“以 上 选项 都 不 是 ”作为 最 可 能 是 正确 答案 的 选项 来 设置 ， 有 些 学 生 知道 这 一 点 。 


@ 使 所 有 选项 可 信 


如 果 一 个 选项 看 起 来 和 其 他 选项 都 不 相关 ,而 且 明 显 可 以 看 出 它 不 是 正确 答案 , 那么 这 个 选 
项 或 许 来 自 测 试 未 覆盖 的 内 容 , 或 许 是 教师 出 于 幽默 原因 而 将 其 加 入 , 这 样 的 选项 不 能 作为 干扰 
项 。 学 生 不 会 考虑 这 个 干扰 项 ,所 以 有 4 个 选项 的 问题 其 实 只 有 3 个 选项 可 供 选 择 ， 这 样 猜 中 答案 
就 变 得 更 容易 了 。 

@ 对 选项 进行 逻辑 排序 或 随机 排序 


有 些 教师 有 这 样 一 种 倾向 : 编写 题 项 的 时 候 让 某 个 答案 选项 〈 比如 B 或 C ) 是 正确 答案 。 学 
生 可 能 会 在 特定 的 教师 那 学 到 这 点 。 此 外 , 一 些 用 于 提高 选择 题 测试 成 绩 的 培训 课程 建议 将 这 一 
点 作为 一 种 应 试 策略 。 教 师 可 以 通过 把 选项 基于 某 个 规则 ( 比如 ， 从 最 短 到 最 长 、 按 字母 、 按 时 
间 先 后 排列 ) 进行 排列 的 方法 来 控制 自己 的 倾向 。 



























































排序 问题 的 另外 一 个 解决 方案 是 : 教师 在 他 们 的 文字 处 理 器 上 滚动 测试 的 初稿 ， 举 
上 肛 试 对 选项 随机 化 处 理 。 当 然 ， 对 于 商业 标准 化 测试 开发 人 员 来 说 ， 计 算 机 随机 化 也 
是 一 个 解决 方案 。 
@ 使 题 干 长 于 选项 
如 果 阅 读 主 体 在 题 王 ， 随 后 紧 跟 简短 的 选项 ， 那 么 答题 速度 会 变 得 更 快 。 





长 题 干 后 跟着 短 选 项 ,使 参加 测试 的 人 员 处 理 起 来 更 加 容易 ， 一 个 好 的 选择 题 项 看 
起 来 应 该 是 这 样 的 : 
































@ 不 要 使 用 否定 词 


3.6 正确 提问 99 





有 些 学 生 比 其 他 学 生 读 得 更 仔细 或 在 文字 处 理 上 更 准确 , 但 “不 是 ”( not ) 这 个 词 还 是 很 容 
易 被 忽视 。 即 使 这 个 词 被 强调 到 每 个 人 都 不 会 忽视 它 , 但 教育 内 容 往 往 不 应 该 作为 非 事 实 或 错误 
陈述 集 来 习 得 ， 而 应 该 作为 积极 的 措辞 真相 来 存储 。 

@ 让 选项 和 题 干 语法 一 致 


比如 ,如 果 题 干 中 使 用 的 语法 很 清楚 地 表明 正确 答案 是 女性 或 是 复数 , 那 确 保 所 有 的 选项 都 
是 女性 或 复数 。 

@ 使 用 整 句 表述 题 干 

如 果 一 个 题 干 是 完整 的 以 问号 结束 的 问题 , 或 是 一 个 完整 的 以 句号 结尾 的 指导 语 , 那 学 生 能 
在 检验 选项 之 前 就 开始 识别 答案 。 如果 题 干 是 以 空白 或 冒号 结尾 , 或 者 说 它 只 是 一 个 不 完整 的 名 
子 ， 那么 学 生 需 要 花费 更 多 的 精力 来 处 理 此 题目 。 而 更 多 的 处 理 提 高 了 错误 的 几率 。 




















3.6.2 ”在 正确 水 平 上 提问 


创建 测试 时 必须 要 克服 的 第 二 个 主要 问题 是 :确认 所 问 问题 的 正确 水 平 有 些 问题 是 简单 的 ， 
它们 只 评估 某 个 人 的 信息 再 认 能 力 , 这 种 能 力 代表 非常 低 的 知识 水 平 。 其 他 问题 更 难 一 点 ,需要 
答题 者 结合 现 有 知识 或 是 将 其 应 用 到 新 问题 或 情境 中 。 因为 不 同 水 平 的 问题 测量 不 同 水 平 的 理解 
力 ， 如 果 想 从 企业 获得 有 用 的 东西 ， 就 必须 在 正确 的 水 平 上 提出 正确 的 问题 。 

有 一 个 聪明 的 教育 研究 人 员 ， 名 叫 本 杰 明 . 布 鲁 姆 ( Benjamin Bloom )， 他 在 20 世 纪 50 年 代 
提出 了 一 种 思考 问题 的 方法 ,以 及 正确 回答 问题 所 需 的 理解 水 平 。 他 的 分 类 体系 后 来 发 展 成 有 名 
的 “ 布 鲁 姆 分 类 法 ”( Bloom's Taxonomy )， 是 一 种 基于 达成 某 种 成 就 或 掌握 某 种 技能 所 需 理解 水 
平 的 教育 目标 分 类 体系 。 布 鲁 姆 和 他 的 同事 给 出 了 学 习 过 程 中 6 种 不 同 的 认 知 阶段 。 按 顺序 由 低 
到 高 排列 ， 分 别 是 : 





























(1) 知识 

词汇 、 事 实 和 概念 的 回忆 能 力 ; 
(2) 理解 

理解 话题 和 交流 话题 的 能 

(3) 应 用 

使 用 广义 知识 解决 不 熟悉 问题 的 能 
(4) 分 析 


将 观点 分 解 并 理解 它们 之 间 关 系 的 能 
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(5) 综合 
从 已 有 知识 创建 一 个 新 模式 或 观念 的 能 力 ; 
(6) 评估 


对 新 观念 的 价值 作出 有 根据 的 判断 的 能 
1. 选择 正确 的 认 知 水 平 


我 们 以 教师 为 例 , 说 明 如 何 分 析 你 想 问 的 问题 的 水 平 。 教 师 为 课堂 目标 选择 合适 的 认 知 水 平 ， 
质量 评估 的 目的 是 衡量 这 些 课 答 目 标的 达成 程度 。 教 师 编写 的 大 多 数 项 目 ， 以 及 那些 课本 、 教 材 
自 带 的 预先 编 好 的 测试 ,都 处 于 知识 水 平 。 大 多 数 研 究 人 员 认 为 这 是 不 成 功 的 ， 因 为 课堂 目标 的 
认 知 水 平 应 该 (总 是 ) 高 于 简单 记忆 信息 所 需 的 认 知 水 平 。 

当 新 教材 被 引进 时 〈 从 学 前 到 高 级 专业 训练 的 任何 阶段 )， 至 少 要 评估 是 否 从 中 学 到 了 基本 
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eay 






































新 知识 。 当 教师 决定 不 仅仅 测量 知识 水 平时 ， 对 项 目 合适 水 平 的 选择 取决 于 学 生 的 发 展 水 平 。 





学 生 的 认 知 水 平 , 尤其 是 抽象 思考 和 理解 的 能 力 ， 以 及 他 们 使 用 多 个 步 又 解决 问题 的 能 力 , 决定 
了 课 符 目 标的 最 佳 水 平 ， 因此, 也 决定 了 测试 项 目的 最 佳 水 平 。 研 究 人 员 认 为 ,教师 应 该 以 他 们 





教 课 的 方式 ,来 测试 他 们 所 教授 的 内 容 。 


所 以 , 任何 时 候 ， 只 要 你 发 现 你 想 评 佑 藏 在 某 人 脑袋 中 的 知识 ， 就 想 想 你 希望 评估 的 理解 力 
水 平 。 基 本 的 记忆 性 知识 足够 吗 ? 如 果 足 够 的 话 , 那么 知识 水 平 就 是 问题 的 合适 水 平 。 你 想 知 道 
应 聘 者 是 否 能 够 使 用 他 的 知识 来 解决 他 从 未 遇 到 过 的 问题 吗 ?” 那 就 在 应 用 水 平 上 进行 提问 , 他 不 




















得 不 证 明 他 是 否 具 有 那 种 能 力 。 
2. 在 不 同 认 知 水 平 设 计 问 题 

















遵循 表 3-5 的 指导 原则 ， 在 布 鲁 姆 分 类 法 的 每 个 水 平 创建 项 目 或 任务 。 


表 3-5: 不 同 认 知 水 平 的 问题 















































谁 写 了 《了 不 起 的 盖 茨 比 》; 
和 A. 福 克 纳 ; B. 菲 茨 杰 拉 德 ; C .海明威 ; D. 斯 坦 贝 克 








如 果 一 个 农民 原来 有 40 英 雷 地 ， 又 买 了 16 英 亩 地 ， 那 
么 现在 他 有 多 少 英亩 地 
画 出 你 邻里 的 地 图 并 确认 每 一 家 



































基于 你 对 人 物 角 色 的 理解 ,描述 《 献 给 阿 杰 尔 农 的 花 》 


( Flowers for Algernon ) 的 续集 会 是 怎样 


























布 鲁 姆 水 平 ”问题 特征 问题 或 任务 示例 
知识 只 需要 死记 硬 背 能 力 ， 例 如 回忆 、 再 认 和 复 
述 技能 
理解 需要 释义 、 归 纳 和 解释 等 技能 什么 是 卷 尾 
应 用 需要 运算 和 解决 问题 等 技能 ， 包 含 使 用 、 计 
算 和 产生 的 词语 
分 析 需要 列 提 纲 、 听 、 逻 辑 和 观察 等 技能 ， 包 含 
确认 和 分 解 的 词语 
综合 需要 组 织 和 设计 的 技能 ， 包 含 对 比 和 比较 的 
词语 
评估 需要 批判 和 形成 观点 等 技能 ， 包 含 支持 和 解 





释 的 词语 














哪 位 音乐 电影 表演 家 可 能 是 最 佳 运动 员 ? 解释 你 的 
答案 


3.7 ”公平 测试 101 





3. 布 鲁 姆 分 类 法 的 适用 范围 

布 鲁 姆 分 类 法 暗含 一 个 等 级 关系 : 知识 代表 认 知 的 最 简单 水 平 ,评估 代表 认 知 的 最 高 和 最 复 
杂 水 平 。 任 何 通过 编写 问题 来 评估 知识 的 人 能 够 在 任意 给 定 水 平 上 编写 项 目 。 教 师 能 够 确认 所 选 
课堂 的 目标 水 平 , 创建 和 此 水 平 匹配 的 评估 。 利 用 客观 计 分 的 项 目 形 式 , 非常 容易 达到 布 鲁 姆 分 
类 法 的 低级 水 平 ， 在 更 高 水 平 上 进行 测量 会 难 一 些 ， 但 也 并 非 不 可 能 。 

你 不 必 对 布 鲁 姆 定义 的 6 个 水 平 之 间 的 细微 差别 有 太 多 担心 。 比 如 ， 理 解 和 应 用 通常 被 看 作 
同义词 ， 因 为 应 用 是 指 应 用 所 学 知识 的 能 力 ， 而 这 种 能 力也 意味 着 理解 。 现 如 今 , 大 多 数 测试 理 
论 家 和 任课 教师 都 非常 关注 知识 水 平和 其 他 水 平 之 间 的 差别 。 大 多 数 教师 , 除了 在 全 新 领域 的 引 
入 阶段 ， 都 更 偏爱 于 教授 和 测量 高 于 知识 水 平 的 目标 。 
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TD 3.7 公平 测试 
4 b 玉 4 有 任课 教 活 经 党 创建 他 们 自己 的 测试 来 测量 学 主 的 学 习 情 况 。 他 们 总 是 担心 测试 是 否 大 
难 吉大 简单 ,是否 测量 到 了 他 们 想 要 测量 的 东西 。 项 目 分 析 工 具 提 俱 了 教师 关 送 同 
题 的 解 闫 方案 。 





课 符 评 佑 可 能 是 如 今 的 教室 里 最 常见 的 活动 。 教 师 总 是 编制 测试 并 给 测试 评分 , 学 生 总 是 为 
测试 而 学 习 并 参加 测试 ， 整 个 过 程 都 是 为 了 支持 学 生 的 学 习 。 测 试 不 应 该 太 难 (或 太 简 单 )， 并 
且 测试 必须 测量 教师 想 测量 的 东西 。 测试 分 数 和 评级 是 教师 和 家 长 、 学 生 、 管 理 人 员 的 沟通 方式 ， 
所 以 位 于 试卷 顶部 的 分 数 要 公平 。 分 数 必须 准确 反映 学 生 的 学 习 情况 , 并 且 分 数 应 该 是 质量 评估 
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的 结果 。 


忧心 昼 虱 的 教师 一 直 为 改进 他 们 的 测试 而 努力 , 但 是 他 们 总 是 没有 坚实 的 数据 支持 , 不 断 在 
黑暗 中 摸索 。 一 位 聪明 且 体贴 的 教师 可 以 通过 什么 来 改进 他 的 测试 或 提高 他 评分 的 效 度 呢 ? 名 
为 项 目 分 析 (item analysis ) 的 一 族 统计 方法 能 给 正在 找寻 开发 公平 评估 和 评分 方法 的 教师 指明 
方向 。 

















3.7.1 项 目 分 析 


项 目 分 析 是 检验 个 体 测试 项 目 课堂 表现 的 方法 。 一 位 任课 教师 也 许 想 检验 他 编写 的 测试 的 部 
分 表现 , 看 他 的 学 生 掌 握 了 哪些 方面 ,而 哪些 方面 需要 多 加 复习 。 一 名 为 护士 资格 证 编制 测试 的 
商业 测试 开发 人 员 也 许 想 要 知道 他 编制 的 测试 中 , 哪些 项 目 是 有 效 的 , 哪些 项 目 看 起 来 测量 的 是 
其 他 事物 ， 应 该 被 移 除 。 

在 上 述 两 种 情况 下 , 测试 开发 人 员 会 对 项 目 难 度 和 项 目 效 度 感 兴趣 。 虽然 其 中 一 个 例子 说 的 
是 一 位 为 学 生 编 制 测试 的 中 学 教师 ， 而 另 一 个 例子 说 的 是 一 个 大 型 一 利 公司 , 但 这 两 类 测试 的 开 
发 人 员 都 对 相同 类 型 的 数据 感 兴趣 ， 都 能 运用 相同 的 项 目 分 析 工 具 。 

































































3.7.2 课堂 评估 问题 的 三 种 类 型 

如 果 你 是 一 名 担心 自己 的 评估 的 任课 教师 , 你 可 能 需要 回答 三 种 不 同类 型 的 问题 。 坟 好， 有 
三 种 项 目 分 析 工 具 会 给 你 提供 三 类 不 同 的 所 需 信息 。 

1. 测试 问题 是 否 太 难 

任何 特定 测试 问题 的 难度 ， 都 可 以 通过 难度 指数 〈difficulty index ) 公式 非常 容易 地 计算 出 
来 。 你 可 以 计算 参加 测试 的 学 生 中 答对 题目 的 人 数 比例 , 从 而 计算 某 个 测试 题目 的 难度 指数 。 比 
例 越 大 ， 知 道 题目 所 测 信息 的 测试 参与 者 越 多 。 





























难度 指数 这 个 术语 是 与 我 们 的 直观 理解 不 同 , 因为 它 实际 上 反映 的 是 题目 的 简单 程 
度 ， 而 不 是 题目 的 难度 。 难 度 指 数 高 的 题目 是 一 个 简单 的 题目 ,而 不 是 一 个 困难 的 


题目 。 


多 难 算 难 ?你 得 自己 决定 。 有 些 教 师 把 难度 指数 为 0.50 或 0.50 以 下 的 题目 视 作 太 难 题目 ， 因 
为 大 多 数 人 没有 答对 。 你 也 许 有 更 高 的 标准 。 如 果 你 认为 大 多 数学 生 应 该 已 经 学 会 了 这 些 内 容 ， 
而 相应 题目 的 难度 指数 显示 班 里 很 大 比例 的 学 生 答 错 了 ， 那 这 个 题目 可 能 太 难 了 。 


2. 实测 是 否 为 想 测 
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测量 学 家 宣称 , 如果 一 个 测试 项 目测 量 的 是 它 想 测 的 东西 , 那么 它 就 是 有 效 的 (valid ) [Hack 
#32]。 辨 别 力 指数 ( discrimination index ) 是 对 项 目 效 度 的 基本 测量 ,此 外 还 要 对 项 目 进行 信和 度 测 
量 。 辨 别 力 指 数 测 量 的 是 项 目 在 整个 测试 中 区 分 得 分 高 的 人 和 得 分 低 的 人 的 能 力 。 

虽然 计算 过 程 有 好 几 步 , 但 计算 出 来 以 后 ,就 可 以 将 这 个 指数 看 作 一 个 程度 指标 : 反映 整个 
内 容 领 域 的 知识 或 技能 掌握 和 项 目 啊 应 的 关系 程度 。 





























辨别 力 指数 的 得 名 不 是 因为 它 代 表 测 试 偏差 。 辨 别 力 是 确认 在 一 个 项 目 上 回答 正确 
的 人 是 属于 高 分 组 还 是 低 分 组 的 能 力 。 


on 


3. 为 什么 我 的 学 生 错 了 一 道 题 

除了 检测 整个 测试 项 目的 表现 , 教师 们 也 对 检验 选择 题 的 个 别 干扰 项 ( 不 正确 选项 ) 的 表现 
感 兴趣 ， 这 种 检验 是 通过 选项 分 析 来 完成 的 。 通 过 计算 选择 每 个 选项 的 学 生 比例 , 教师 能 看 到 学 
生 犯 了 哪 种 类 型 的 错误 。 他 们 是 否 理解 错 了 某 些 概念 ” 他们 对 资料 是 否 有 相同 的 困惑 ? 

从 测量 学 角度 看 , 为 了 改进 项 目的 效果 , 教师 们 应 该 确认 哪些 干扰 项 是 有 效 的 , 看 起 来 对 那些 
不 知道 正确 答案 的 学 生 有 干扰 作用 ; 哪些 干扰 项 只 是 占用 一 个 选项 位 置 ， 很 多 学 生 都 不 会 选择 它 。 

为 了 消除 纯 属 偶然 的 、 仅 靠 猜测 就 答对 题目 的 现象 , 教师 和 测试 开发 人 员 要 设置 尽 可 能 多 的 
可 信 干 扰 项 。 对 反应 选项 进行 分 析 , 教师 能 够 调整 、 改 进 这 些 也 许 会 在 今后 的 课堂 里 再 次 使 用 的 
项 日 [ey 
































3.7.3 ”进行 项 目 分 析 并 解释 结果 

下 面 是 项 目 分 析 的 计算 方法 , 我们 以 带 有 数据 的 示例 项 目 进行 说 明 。 在 此 例 中 , 想象 有 一 个 
课堂 ， 共 25 名 学 生 参与 了 表 3-6 中 项 目的 测试 ( 要 记 住 ， 即 使 是 标准 化 测试 开发 人 员 对 更 大 规模 
的 、 成 百 上 千 的 测试 参与 者 进行 测试 ， 也 使 用 相同 的 方法 )。 




















& 表 3-6 中 选项 旁 的 星 号 代表 B 是 正确 答案 。 


表 3-6: 项 目 分 析 示 例 
“ 谁 写 了 《了 不 起 的 盖 茨 比 》” 一 题 的 答案 选择 每 个 答案 的 学 生 数量 








A. 福 克 纳 4 
B. 菲 茨 杰 拉 德 * 16 
C. 海明威 5 
D. 斯 坦 贝克 0 
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为 了 计算 难度 指数 : 
(1) 计算 获得 正确 答案 的 人 数 ; 
(2) 除 以 参加 测试 的 总 人 数 。 
在 表 3-5 的 示例 中 ，25 人 里 有 16 人 获得 了 正确 答案 : 
16/25=0.64 

难度 指数 范围 是 0.00~1.0。 在 我 们 的 例子 中 , 项 目 难 度 指 数 是 0.64。 这 意味 着 64% 的 学 生 知道 
正确 答案 。 

如 果 一 位 教师 认为 0.64 太 低 了 ， 那 么 他 有 一 系列 措施 可 供 采 取 。 他 可 以 改变 他 的 教学 方式 来 
更 好 地 满足 项 目 所 代表 的 教学 目标 。 另 一 个 解释 可 能 是 项 目 太 难 了 ， 或 具有 迷惑 性 ， 或 者 无 效 ， 
在 这 种 情况 下 ， 教 师 可 以 使 用 项 目 辨别 力 指数 或 反应 选项 分 析 的 信息 来 替换 或 修改 项 目 。 

为 了 计算 辨别 力 指数 ; 

(1) 按照 总 分 对 测试 成 绩 排 序 ， 创 建 两 个 组 : 高 分 组 ( 由 排序 结果 的 上 半 部 分 构成 ) 和 低 分 
组 (由 排序 结果 的 下 半 部 分 构成 ); 

(2) 对 每 一 组 ， 计 算 项 目的 难度 指数 ; 

(3) 用 高 分 组 难度 指数 减 去 低 分 组 难度 指数 。 

假设 在 我 们 的 例子 中 ， 高 分 组 中 的 13 个 学 生 (或 测试 ) 里 有 10 人 ， 低 分 组 中 的 12 个 学 生 有 6 
人 ， 答 对 了 本 题目 。 高 分 组 的 难度 指数 是 0.77 ( 10/13 )， 低 分 组 的 难度 指数 是 0.50 (6/12 )， 所 以 
我 们 能 够 像 这 样 计算 辨别 力 指数 ， 















































0.77-0.50=0.27 
该 项 目的 辨别 力 指数 为 0.27。 辩 别 力 指数 范围 为 -1.0~1.0。 正 值 越 大 ( 越 接近 1.0 )， 总 体 测 试 
表现 和 这 个 项 目 表 现 的 相关 性 越 强 。 
如 果 辨 别 力 指数 是 负 的 , 那 意味 着 出 于 某 种 原因 ， 测试 总 分 低 的 学 生 更 可 能 答对 这 道 题 。 这 
是 一 种 奇怪 的 现象 ,表明 题 上 日 效 度 很 糟糕 , 或 者 参考 答案 是 错 的 。 教师 总 是 希望 测试 上 的 每 个 项 
目 都 是 有 效 的 ， 能 反映 知识 和 技能 的 掌握 程度 。 








0 
么 数字 就 是 正 的。 所 以 ， 至少 教 师 会 希望 出 现 正 值 ， 因 为 那 将 意味 着 获得 正确 结果 
是 因为 掌握 了 知识 ， 而 不 是 靠 猜 测 。 


我 们 能 利用 表 3-6 提 供 的 信息 ， 来 看 不 同 选 项 的 受 欢 迎 程度 ， 如 表 3-7 所 示 。 
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表 3-7:“ 谁 写 了 《了 不 起 的 盖 茨 比 》” 项 目 分 析 





答案 选项 受 欢迎 程度 难度 指数 
A. 福 克 纳 4/25 0.16 
B. 非 次 杰 拉 德 * 16/25 0.64 
C. 海明威 5/25 0.20 
D. 斯 坦 贝克 0/25 0.00 














选项 分 析 结 果 显 示 ， 没 有 答对 这 道 题 的 学 生 可 能 选择 了 答案 A 或 答案 C。 没 有 学 生 选 答案 D， 
所 以 选项 D 并 没有 充当 干扰 项 。 在 这 个 项 目 上 ， 学 生 不 是 在 4 个 答案 选项 中 选择 ， 实 际 上 只 是 在 3 
个 选项 中 选择 ， 因 为 他 们 甚至 都 没 考虑 选项 D。 

这 样 一 来 ， 猜 对 的 可 能 性 就 更 大 了 ， 从 而 降低 了 项 目的 效 度 。 教 师 可 能 将 这 个 数据 视 为 如 下 
现象 的 证 据 : 大 多 数学 生 在 《了 不 起 的 盖 欧 比 》 和 菲 茨 杰 拉 德 之 间 建 立 起 了 联系 , 没 建立 起 这 种 
联系 的 学 生 无 法 很 好 地 区 分 福 克 纳 和 海明威 。 























3.7.4 对 项 目 分 析 和 测试 公平 性 的 建议 

为 了 改进 测试 质量 ， 可 利用 项 目 分 析 确 认 出 太 难 (或 太 简 单 ， 如 果 教 师 有 这 种 担心 的 话 ) 的 
项 目 ， 但 无 法 区 分 出 掌握 内 容 的 学 后 和 没 掌握 内 容 的 学 和 后， 或 者 说 存在 不 可 信 的 干扰 项 。 

如 果 作 为 一 名 教师 ， 你 关心 测试 的 公平 性 ,那么 你 可 以 改变 教学 方式 ,改变 测试 方式 ， 或 是 
改变 评级 方式 。 

@ 改变 教学 方式 

如 果 有 些 项 目 太 难 , 那么 你 可 以 调整 教学 方式 。 你 可 以 着 重 教授 未 学 会 的 内 容 或 者 采用 不 同 
的 教学 策略 。 你 也 许 能 明确 调整 教学 方法 来 纠正 学 生 对 内 容 的 困惑 和 误解 。 

@ 改变 测试 方式 

如 果 项 目 有 低 的 或 负 的 辨别 值 , 那 可 以 把 它们 从 当前 测试 中 移 除 , 也 可 以 在 将 来 的 测试 中 将 
它们 从 项 目 库 里 移 除 。 你 同样 可 以 检验 项 目 ， 尝 试 发 现 它 的 不 妥 之 处 ， 然 后 改变 该 项 目 。 当 于 扰 
项 被 确认 为 无 效 ( 没 人 选择 它们 ) 时 , 教师 能 够 改进 项 目 并 创建 一 个 新 的 干扰 项 。 有 效 和 可 信 测 
试 的 一 个 目标 是 降低 学 生 随机 猜测 出 正确 答案 由 此 获取 分 数 的 几率 。 可 信和 干扰 项 的 数量 越 多 , 测 
试 通常 越 准确 、 越 有 效 、 越 可 信 。 

@ 改变 评分 方式 

你 可 以 使 用 项 目 分 析 信息 来 判断 哪些 内 容 是 没有 教授 的 ,为 公平 起 见 ， 从 当前 测试 中 移 除 该 
项 目 ， 并 重新 计算 分 数 。 对 任课 教师 而 言 ， 最 简单 的 做 法 是 : 计算 出 一 个 测试 中 的 不 良 项 目 数 ， 
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并 将 这 个 数字 加 到 每 个 学 生 的 分 数 上 。 此 方法 与 把 这 些 项 目 当 做 不 存在 而 重新 计 分 的 方法 在 技术 
上 是 不 同 。 但 是 这 样 的 话 , 学 生 如 果 管 对 了 某 个 难度 较 高 的 项 目 , 他 们 依然 能 够 获得 该 项 目的 分 
数 ， 对 大 多 数 教师 来 说 ， 这 种 方法 看 起 来 更 加 公平 。 

这 些 教师 对 测试 质量 的 关心 和 科学 家 提出 的 研究 问题 没有 太 大 差异 。 就 像 科学 家 一 样 , 教师 
可 以 在 他 们 的 课堂 上 收集 、 分 析 数 据 并 解释 结果 。 他 们 能 够 基于 自身 的 认 知 体系 , 决定 对 结果 采 
取 什 么 样 的 措施 。 


























,Ee 3.8 什么 都 不 做 也 能 提高 测试 分 数 
加 1 上 如 采 你 对 刚刚 参加 过 的 一 场 利害 依 关 的 测度 分 数 不 满 意 ,也 许 你 应 该 再 次 参加 这 个 测 
试 。 你 澳 得 呢 ? 


我 们 已 经 讨论 了 如 何 运 用 信 度 [Hack #6] 的 概念 来 精确 测量 事物 。 信和 度 是 指 测试 评 佑 结果 的 一 
致 性 。 换 名 话说， 可 信 的 测试 产生 稳定 的 分 数 , 不 可 信 的 测试 无 法 产生 稳定 的 分 数 。 由 于 测试 不 
是 完全 可 信 的 , 所 以 其 产生 的 分 数 至 少 有 一 部 分 是 有 随机 性 的 , 这 些 分 数 按照 统计 学 家 预测 的 方 
式 上 下 波动 。 因 为 当 你 再 次 参加 测试 时 ,你 的 分 数 往 往 在 测试 的 平均 分 上 下 波动 ， 所 以 这 种 效应 
叫做 均值 回归 效应 (Tiegression toward the mean )。 

当 你 参加 一 些 利益 依 关 的 测试 时 ， 比 如 SAT、ACT 、GRE 、LSATI 或 MCAT ， 你 总 是 有 重新 参 
加 测试 来 尽力 提高 分 数 的 机 会 。 关于 是 否 值得 花 时 间 、 精 力 和 金钱 去 尝试 提高 你 的 分 数 ， 取 决 于 
对 测试 信 度 的 理解 以 及 仅 通过 简单 的 均值 回 效应 来 提高 分 数 的 可 能 性 。 
































3.8.1 均值 回归 


首先 ， 让 我 们 制造 出 一 个 均值 回归 ， 这 样 你 就 会 相信 ， 只 因为 正 态 曲 线 [Hack 过 3] 特 征 ， 分 
数 就 能 在 预测 方向 上 改变 。 眼 见 为 实 ， 我 希望 在 你 眼前 呈现 这 个 无 形 的 神奇 现象 。 

把 表 3-8 中 的 判断 题 发 给 你 关系 最 好 的 100 个 朋友 。 嗯 , 好 吧 , 也 许 包 括 你 在 内 有 10 个 人 也 行 。 
1000 个 会 更 好 ,只 要 数量 足以 让 我 向 你 证 明 回 归 的 发 生 即 可 。 我 们 准备 这 项 测验 时 要 记 住 ,如 果 
有 100 个 或 是 1000 个 人 参加 这 个 非常 难 ( 或 简单 ) 的 测试 ， 那 结果 会 更 令 人 信服 。 

对 于 这 个 测试 ， 你 不 需要 看 实际 的 问题 。 这 个 测试 的 测量 内 容 和 结构 [Hack #32] 不 需要 任何 
改变 ， 分 数 就 会 改变 。 所 以 , 在 这 个 小 测试 上 ， 你 所 能 做 的 就 是 猜 。 因 为 它们 是 判断 题 ， 所 以 每 
道 题 你 都 有 50% 的 几率 答对 。 你 那 10 人 测试 组 〈 或 是 100 人 ， 如 果 你 真 的 很 在 意 这 点 …… 你 能 
至 少 找到 30 人 吗 ? ……， 还 有 谁 愿意 参加 ) 的 平均 分 应 该 是 5 分 ( 满分 为 10 分 )。 
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表 3-8: 高 等 量子 物理 小 测试 

问题 出 你 的 答案 

1. | 或 错 
| 或 错 
[或 错 
[或 错 
[或 错 
[或 错 
[或 错 
| 或 错 
[或 错 


[或 错 





2 
3 
4 
5 
6. 
7 
8 
9 


10. 








让 你 所 能 联系 上 的 所 有 人 都 来 参与 这 个 高 等 量子 物理 测试 。 当 你 和 其 他 人 参加 这 个 测试 时 ， 
即使 标准 答案 近 在 赎 尺 ( 在 表 3-9 里 )， 也 不 要 作 炊 去 看 标准 答案 ! 
表 3-9: 高 等 量子 物理 测试 标准 答案 


1. 对 2. 对 3. 错 4. 错 5. 对 
6. 错 7. 错 8. 对 9. 对 10. 错 





把 这 些 完成 的 测试 (确保 他 们 都 填写 了 名 字 ) 收集 上 来 ， 然 后 对 照 表 3-9 中 的 答案 进行 计 分 。 

现在 , 选 出 你 小 组 的 得 分 最 高 者 ( 这 可 能 代表 某 些 和 你 一 样 的 人 , 他 们 在 标准 测试 , 比如 SAT 
中 , 得 分 高 于 平均 分 ), 得 分 最 低 者 ( 这 也 许 表示 某 些 和 你 不 一 样 的 人 , 他 们 的 得 分 比 平均 分 低 )。 
对 这 两 个 人 再 次 进行 测试 〈 他 们 没有 查看 正确 答案 )， 然 后 再 次 计 分 。 

下 面 均值 回归 起 作用 了 。 不 需要 了 解 你 或 你 的 朋友 ,也 不 需要 知道 他 们 的 答案 是 
件 事情 我 相当 肯定 : 
口 第 一 次 得 分 最 低 的 那个 人 ， 第 二 次 的 得 分 会 比 他 第 一 次 的 高 ; 
口 第 一 次 得 分 最 高 的 那个 人 ， 第 二 次 的 得 分 会 比 他 第 一 次 的 低 。 

如 果真 是 如 此 , 那么 啊 哈 ! 我 早 就 告诉 你 了 嘛 ! 如 果 不 是 这 样 , 我 跟 你 说 的 只 是 “相当 肯定 ” 
而 已 。 如 果 有 更 大 的 样本 ,结果 如 此 的 可 能 性 也 更 大 。 





























么 , 有 两 


全 


























3.8.2 ”生效 原理 


我 们 对 这 两 个 分 数 的 预期 是 : 所 有 低 于 5 分 (或 是 你 测试 的 平均 数 ) 的 测试 分 数 会 同上 移动 ， 
趋向 平均 数 ; 所 有 高 于 5 分 的 测试 分 数 会 向 下 移动 ， 趋 向 平均 数 。 你 的 两 个 分 数 可 能 会 出 现 这 种 
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情况 ， 也 可 能 没有 出 现 这 种 情况 ， 但 它 是 最 可 能 的 结 

记 住 ， 这 是 一 项 知识 对 分 数 没有 影响 的 测试 。 两 次 分 数 都 完全 是 由 几率 导致 的 。 但 是 ， 即 使 
在 知识 会 影响 分 数 的 真实 测试 中 , 这 种 效应 也 会 出 现 。 那 是 因为 没有 一 个 真实 测试 是 完全 可 信和 的， 
几率 在 每 个 测试 上 多 少 会 起 点 作用 。 这 个 例证 只 是 将 测试 置 于 几率 百 分 百 地 影响 测试 人 员 分 数 的 
情境 下 ， 由 此 伟大 了 这 种 效应 。 

那么 ， 为 什么 在 第 二 次 测试 时 ， 分 数 可 能 发 生 改 变 并 向 平均 数 靠拢 呢 ? 从 长 远 来 看 ， 有 100 
个 或 1000 个 测试 分 数 集合 , 我们 会 期 望 某 种 像 正 态 分 布 的 结果 。 就 像 扔 硬币 一 样 ( 结果 可 以 是 正 
面 或 反面 ， 两 种 情况 下 的 几率 都 是 50% )， 在 判断 题 测试 上 (或 任意 测试 )， 概 率 都 是 和 特定 的 结 
果 联 系 在 一 起 的 。 表 3-10 展 示 了 高 等 量子 物理 测试 中 ,可 能 的 分 数 以 及 测试 人 员 得 到 那个 分 数 的 
概率 。 


表 3-10: 可 能 的 测试 分 数 分 布 


0.001 
0.010 
0.044 
0.117 
0.205 
0.246 
0.205 
0.117 
0.044 
0.010 
0.001 


为 什么 很 极端 的 分 数 在 重复 测试 后 变 得 不 那么 极端 了 ? 看 看 得 到 两 个 极端 分 数 ( 比如 第 一 次 
是 2 分 ， 然 后 第 二 次 也 是 2 分 ) 的 概率 ， 对 比 第 一 次 分 数 是 2 分 (概率 是 0.044 )， 然 后 第 二 次 是 4 分 
(概率 是 0.205 ) 的 概率 。 一 个 人 第 一 次 得 2 分 , 第 二 次 得 4 分 的 概率 几乎 是 两 次 都 得 2 分 概率 的 5 倍 。 
几乎 有 95% 的 把 握 说 他 会 获得 高 于 2 分 的 分 数 ( 1-0.044-0.010-0.001=0.945 )。 
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究 父 母 和 成 年 子女 的 身高 问题 。 他 发 现 , 成 年 子女 的 平均 身高 更 接近 于 所 有 成 年 子 
女 的 平均 身高 ， 而 不 是 他 们 父母 的 平均 身高 。 虽 然 高 尔 顿 把 这 个 观察 结果 称 作 “ 平 
庸 回归 ”( 由 此 高 尔 顿 不 再 仅仅 作为 外 交 家 而 知名 )， 但 我 们 会 友善 一 点 。 这 和 遗传 
没有 任何 关系 ， 但 和 统计 有 密切 联系 。 


这 个 测试 的 分 数 完全 受 几 率 影响 , 有 65.6% 的 几率 能 得 到 平均 数 或 非常 接近 平均 数 的 分 数 (4 


i “均值 回归 ”一 词 得 名 于 著名 的 弗朗西斯 ' 高 尔 顿 ( 查 尔 斯 .达尔文 的 堂 弟 )， 他 研 
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分 、5 分 和 6 分 的 组 合 概率 )。 对 于 大 多 数 测试 来 说 ， 它 们 有 着 更 多 的 题目 数 ， 形 成 正 态 分 布 ， 这 
样 你 有 68% 的 几率 获得 平均 数 或 接近 平均 数 的 分 数 [Hack #23]。 


3.8.3 ”预测 获得 更 高 分 数 的 可 能 性 


有 趣 倒是 有 趣 , 但 它 如 何 帮 助 你 判断 是 否 值得 再 次 参加 测试 呢 ?” 这 就 回 到 了 我 们 最 初 的 两 难 
问题 上 。 再 次 参加 这 些 重 要 测试 〈 比如 大 学 录取 测试 )， 会 花费 更 多 的 钱 、 时 间 并 带 来 更 大 的 压 
力 ， 也 许 还 需要 准备 ， 所 以 我 们 需要 战略 性 地 决定 什么 时 候 再 次 重 试 。 














” ”当然 , 你 可 以 通过 提高 测试 所 需 的 知识 水 平 来 真正 提高 自己 的 考试 成 绩 。 如 果 你 通 

nw 过 学 习 、 参 加 模拟 考试 或 预备 课程 等 来 准备 测试 , 你 可 能 会 获得 更 高 的 分 数 。 但 是 ， 

如 果 你 获得 很 低 的 分 数 , 那么 即使 在 两 次 测试 间隔 期 你 什么 都 不 做 也 有 可 能 提高 分 

数 ， 就 因为 均值 回归 。 你 能 在 两 次 测试 间隔 期 很 轻松 ， 而 分 数 依然 可 能 提高 。 真 是 
幸运 儿 ! 











只 通过 再 次 参加 测试 ， 你 就 能 获得 更 高 的 分 数 ,这 种 可 能 性 取决 于 两 件 事 : 你 第 一 次 的 测试 
分 数 和 测试 的 信和 度 。 

@ 你 的 分 数 

因为 分 数 可 能 ( 只 因为 几率 ) 向 平均 数 移动 ， 给 你 第 二 次 机 会 ， 你 能 做 得 更 好 的 几率 取决 于 
你 第 一 次 的 分 数 究竟 低 于 还 是 高 于 平均 数 。 把 平均 数 想象 成 你 听见 的 巨大 叭 吸 声 , 它 将 所 有 的 分 
数 沿 着 分 布 拉 向 它 。 平 均 数 以 下 的 分 数 比 平均 数 以 上 的 分 数 更 有 可 能 上 升 。 

@ 测试 的 信 度 

测量 统计 学 家 用 一 个 数字 表示 信和 度 , 代表 并 非 由 几率 导致 的 分 数 变异 比例 。 那么 , 信和 度 越 高 ， 
几率 在 决定 你 分 数 时 起 的 作用 越 低 。 可 信和 分 数 是 稳定 的 分 数 , 平均 数 的 超级 哆 吸力 不 如 一 个 可 信 
分 数 。 

统计 学 家 已 经 开发 出 了 一 个 公式 , 你 能 运用 这 个 公式 计算 分 数 的 变化 空间 。 如 果 有 足够 的 成 
长 空间 ,你 可 能 考虑 第 二 次 尝试 。 这 里 用 到 的 一 个 非常 有 用 的 工具 是 测量 标准 误差 。 下 面 是 测量 
标准 误差 [Hack #6] 的 公式 。 


















































标准 误差 = 标准 差 V1I- 信 度 
大 多 数 标 准 测试 在 每 次 执行 期 间 , 都 会 发 布 由 测试 产生 的 成 千 上 万 个 分 数 的 信 度 水 平和 期 望 
标准 差 。 通 过 将 这 些 测试 的 值 代入 测量 标准 误差 的 方程 式 里 , 会 对 从 测试 到 重 测 的 分 数 变 异 有 一 
个 大 致 概念 ， 这 种 变异 可 能 在 被 测 人 员 没 有 任何 真正 改变 的 情况 下 发 生 。 
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但 是 , 即使 是 标准 误差 , 对 极端 分 数 来 说 , 也 可 能 出 现 误导 。 非常 低 的 分 数 和 非常 高 的 分 数 ， 
仅 由 几率 导致 的 移动 距离 可 能 比 标准 误差 建议 的 距离 要 大 。 你 离 正 态 越 远 , 抗拒 正 态 分 布 的 万 有 
引力 就 越 难 。 极 端 分 数 无 法 抗拒 那 种 引力 ， 除 非 它们 是 完全 可 信和 的 。 

总 之 ， 下 面 是 关于 如 何 决 定 是 否 该 重新 参加 测试 的 合理 建议 。 
口 如 果 你 获得 了 相对 很 高 的 分 数 ， 但 没有 高 到 你 期 望 的 水 平 ， 那 么 可 能 不 值得 再 参加 一 次 
测试 。 
口 如 果 你 获得 的 分 数 很 低 ( 远 低 于 平均 )， 几 乎 可 以 肯定 你 第 二 次 的 分 数 会 更 高 。 再 试 一 次 

吧 。 第 二 次 你 应 该 也 更 努力 了 一 些 。 





























TO 3.9 建立 信和 度 
l ;各 基站 对 使 用 、 编 制 和 参加 利益 依 关 的 测试 的 人 而 言 ， 建 立 测试 分 数 的 准确 性 是 很 有 利 约 。 
幸好 ， 款 育 和 心理 测量 领 韦 提供 了 几 种 方法 可 以 验证 测试 分 数 的 一 臻 性、 准确 性 ， 

并 表明 其 可 信 程 度 。 





任何 使 用 测试 来 进行 重大 决策 的 人 , 都 需要 确定 产生 的 分 数 是 准确 的 , 并 且 分 数 没 受到 大 多 
随机 作用 的 影响 ， 比 如 那天 早晨 的 应 聘 者 是 否 吃 了 早饭 , 或 学 生 在 测试 期 间 是 否 过 度 紧 张 。 测试 
开发 人 员 需 要 建立 信 度 来 说 服 他 们 的 客户 相信 可 以 依赖 产生 的 结果 。 

也 许 ， 最 重要 的 是 ， 当 你 参加 一 项 关乎 能 否 被 录取 ,或 决定 是 否 会 晋升 为 首席 餐饮 大 后 的 测 
试 时 ， 你 需要 知道 分 数 反 映 了 你 的 典型 水 平 。 本 Hack 展 现 了 信 度 测量 的 几 种 方法 。 















































3.9.1 信和 度 的 重要 性 

首先 ,讲解 一 些 关 于 测试 信 度 的 基础 知识 , 以 及 你 为 什么 要 找 出 你 所 参加 的 重要 测试 的 信 度 
证 据 。 人 们 期 望 测试 和 测量 工具 有 一 致 性 , 不 管 是 内 部 的 ( 用 相似 方法 测量 相同 的 构造 行为 ) 还 
是 外 部 的 〈 如 果 横 跨 不 同时 间 反 复 执行 ,那么 得 到 相似 的 结果 )。 这 些 都 是 信和 度 的 问题 。 

信 度 通过 统计 方法 来 测量 , 可 以 通过 计算 一 个 特定 的 数字 来 代表 一 个 测试 的 一 致 性 水 平 。 大 
多 数 信和 度 指 标 基于 如 下 相关 [Hack #11]: 对 测试 项 目 做 出 的 反应 之 间 的 相关 ， 或 一 个 测试 的 两 个 
分 数 集 之 间 的 相关 ， 或 是 一 个 测试 两 次 计 分 的 相关 。 

有 四 种 常见 的 信 度 类 型 用 来 确立 一 个 测试 产生 的 分 数 是 否 不 包含 太 多 随机 变异 : 

@ 内 部 信 度 

每 个 参 试 者 的 表现 在 同一 个 测试 中 的 不 同 项 目 间 是 否 一 致 ? 
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@ 重 测 信 度 

执行 同一 测试 两 次 ， 每 个 参 试 者 的 表现 是 否 一 致 ? 

@ 内 部 评分 者 信 度 

如 果 两 个 不 同 的 人 给 测试 评分 ， 参 试 者 的 表现 是 否 一 致 ? 
@ 平行 信 度 

采取 不 同形 式 执行 同一 个 测试 ， 参 试 者 的 表现 是 否 一 致 ? 


3.9.2 ”计算 信和 度 


如 果 你 已 经 编制 了 一 个 你 想 使 用 的 测试 不 管 你 是 一 名 教师 、 一 位 人 事主 管 还 是 一 位 临床 
医学 家 ， 你 都 想 证 实 你 的 测试 是 可 信 的 。 你 用 来 计算 准确 性 水 平 的 方法 取决 于 你 感 兴趣 的 信和 度 
类 型 。 

1. 内 部 信 度 

最 常见 的 信 度 测量 是 内 部 一 致 性 测量 , 也 称 作 a 系数 (或 克隆 巴赫 系数 )。 系 数 x 是 一 个 几乎 
总 是 介 于 0.00~1.00 的 数字 。 值 越 大 ， 测 试 项 目的 内 部 一 致 性 越 高 。 

如 果 你 参加 一 个 测试 并 把 测试 分 成 两 半 ， 比 如 奇数 项 为 一 半 ,， 偶数 项 为 另 一 半 ,， 你 能 计算 出 
这 两 半 的 相关 性 。 计 算 “ 分 半 相 关 ”( split-half correlations ) 的 公式 就 是 计算 相关 系数 的 公式 [Hack 
#11]， 并 且 计 算 分 半 相 关 是 一 种 常用 的 估计 信和 度 的 方法 ， 虽 然 分 半 信 和 度 现在 被 认为 有 点 过 时 。 

从 数学 上 讲 , 计算 系数 “的 公式 产生 了 一 个 测试 所 有 分 半 可 能 的 平均 相关 , 并 且 已 经 替代 了 
分 半 相 关 ， 成 为 了 估计 内 部 信和 度 的 首选 。 因 为 这 个 方程 的 计算 比较 复杂 ， 通 常用 电脑 来 计算 这 
个 值 。 


















































_ nn {5D’ -SD 
n—l SD? 

n 代 表 测 试 的 项 目 数 ，SD 代 表 测 试 的 标准 差 ， 5S 表示 加 总 ，SD, 表示 每 个 项 目的 标准 差 。 

2. 重 测 信和 度 

内 部 一 致 性 被 认为 是 代表 测试 信和 度 的 合适 证 据 , 但 在 一 些 情况 下 , 有 必要 证 明 过 一 段 时 间 后 
问卷 的 一 致 性 。 

如 果 被 测量 的 事物 随 着 时 间 推 移 不 会 改变 , 或 者 它 会 缓慢 改变 , 那么 ,如 果 在 两 个 不 同时 间 
执行 相同 的 测试 , 相同 群体 的 反应 应 该 非常 一 致 。 这 样 两 个 分 数 集合 之 间 的 相关 会 反映 测试 随 着 
时 间 推 移 的 一 致 性 。 
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3. 内 部 评分 者 信 度 

当 不 止 一 人 观察 测试 评分 时 , 我 们 同样 能 够 计算 信 度 。 采 用 不 同 评分 者 的 评分 时 可 以 证 明 不 
同 评分 者 的 一 致 性 。 甚 至 只 有 一 名 评分 者 ( 如 一 位 任课 教师 ) 时 ， 如 果 评 分 是 完全 主观 的 ， 因 为 
大 多 数 题目 是 问答 题 和 绩效 评 佑 ， 那 么 这 种 类 型 的 信 度 也 有 很 大 的 理论 意义 。 

为 了 在 这 些 情况 下 , 证 明 个 体 的 分 数 代表 典型 表现 , 必须 证 明 即 使 使 用 不 同 的 评判 员 、 计 分 
员 或 评定 者 , 结果 也 是 没有 差异 的 。 内 部 评分 者 信和 度 水 平 的 确定 通常 是 建立 一 系列 评分 者 的 分 数 
相关 性 或 计算 他 们 意见 一 致 程度 的 百分比 。 

4. 平行 信和 度 

最 后 , 我 们 能 通过 论证 下 面 这 个 问题 来 证 明 信 度 : 一 个 人 参加 何 种 测试 的 形式 不 重要 , 他 在 
这 些 测试 上 都 会 获得 相同 的 分 数 。 只 有 测试 是 从 大 项 目 池 中 构建 时 ， 才 有 必要 证 明 平 行 信和 度 。 

比如 说 ， 很 多 标准 化 大 学 的 入 学 测试 ， 例 如 SAT 和 ACT， 不 同 的 参 试 人 员 参 加 不 同 版 本 的 测 
试 , 这 些 测试 是 由 履 盖 相 同 主题 的 不 同 问题 构成 的 。 这 样 的 话 ， 即 使 你 周 六 早晨 在 缅 因 州 参加 了 
测试 ， 也 无 法 给 你 在 加 利 福 尼 亚 的 堂 兄 打 电 话 告诉 他 具体 的 考题 ， 以 便 他 为 下 周 的 考试 作 准 备 ， 
因为 你 的 堂 兄 可 能 在 他 考试 时 遇 到 一 组 不 同 的 问题 。 

当 公 司 编制 不 同形 式 的 相同 测试 时 , 他 们 必须 证 明 那 些 不 同形 式 的 测试 难度 相同 , 还 有 其 他 
相似 的 统计 属性 。 最 重要 的 是 ,他 们 必须 证 明 ,你 的 缅 因 州 版 本 的 测试 分 数 会 和 加 利 福 尼 亚 版 本 
的 测试 分 数 相同 。 

























































































3.9.3 ”解释 信 度 证 据 


有 多 种 方法 可 供 建立 测试 信 度 , 不 同 目的 的 测试 应 该 有 不 同 的 信和 度 证 据 。 你 能 根据 信和 度 系数 
的 大 小 来 决定 你 刚刚 编制 的 测试 是 否 需要 改进 。 如 果 你 只 是 参加 测试 或 只 利用 测试 提供 的 信息 ， 
那 你 能 用 信 度 的 值 来 判断 是 否 应 该 相信 测试 的 结果 。 






































@ 内 部 信 度 
只 设计 用 来 做 重要 决策 的 测试 , 应 该 有 非常 高 的 内 部 信和 度 , 这 样 一 个 人 在 这 个 测试 中 获得 的 
分 数 应 该 会 非常 准确 。 虽 然 只 是 一 个 经 验 法 则 ,， 但 人 们 通常 认为 0.70 或 更 高 的 a 系数 是 声明 一 项 























测试 具备 内 部 信 度 所 必需 的 。 对 于 你 来 编制 或 参加 的 测试 , 还 是 你 自己 决定 多 大 的 信和 度 是 可 接受 
的 吧 。 

@ 重 测 信 度 

像 很 多 社会 科学 研究 设计 一 样 , 一 个 用 来 测量 随时 间 推 移 发 生 的 变化 的 测试 , 应 该 展示 良好 
的 重 测 信 度 。 良 好 的 重 测 信 度 意味 着 多 次 测试 之 间 分 数 的 改变 不 是 由 随机 波动 导致 的 。 稳 定 相关 
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系数 的 合适 大 小 取决 于 随 着 时 间 的 推移 ,结构 的 理论 稳定 程度 。 那么 ,取决 于 它 的 特征 ， 随 着 时 
间 的 推移 ， 测 试 产生 分 数 的 相关 性 介 于 0.60~1.00。 

@ 内 部 评分 者 信 度 

内 部 评分 者 信和 度 只 有 在 计 分 受 主 观 因素 影 响 的 情况 下 ， 比 如 写 论文 测试 ， 才 会 邻 人 关注 。 客 
观 的 、 计 算 机 计 分 的 选择 题 测试 应 该 产生 完美 的 内 部 评分 者 信和 度 ， 所 以 通常 对 客观 测试 来 说 ,不 
会 产生 那 种 类 型 的 证 据 。 如 果 内 部 评分 者 相关 被 用 来 估计 内 部 评分 者 信和 度 ， 那 么 根据 经 验 法 则 ， 
0.80 是 最 小 可 接受 的 内 部 评分 者 信和 度 水 平 。 

有 时 ,内 部 评分 者 信 度 通过 报告 两 位 评分 者 意见 一 致 性 的 百分比 来 估计 。 用 一 致 百分比 来 估 
计时 ， 通 常 认 为 比例 达到 85% 就 足够 了 。 

@ 平行 信 度 

只 有 存在 不 同形 式 的 测试 才能 被 描述 为 具有 平行 信和 度 。 你 的 大 学 教授 可 能 不 需要 建立 平行 信 
度 ， 因 为 期 未 测试 只 有 一 个 版 本 ， 但 是 大 规模 的 测试 公司 可 能 需要 建立 平行 信和 度 。 

平行 信和 度 应 该 非常 高 ,这 样 人 们 能 将 测试 的 任何 形式 视 作 具有 同等 意义 。 通常 来 说 , 一 项 测 
试 两 种 形式 之 间 的 相关 性 应 该 高 于 0.90。 测 试 公司 采取 这 样 的 研究 方式 : 一 群 人 都 按照 两 种 形式 
参加 这 项 测试 ， 以 此 来 计算 平行 信和 度 系 数 。 

在 你 参加 一 项 利益 侯 关 的 、 关 平 未 来 发 展 的 测试 之 前 , 确保 测试 有 可 接受 的 信和 度 水 平 。 你 希 
望 看 到 的 信和 度 类 型 证 据 取 决 于 测试 的 目的 。 









































3.9.4 ”改进 测试 信和 度 


要 确保 测试 有 一 个 高 a 系数 或 其 他 任何 信和 度 系 数 ， 最 简单 的 方法 是 增加 测试 的 长 度 。 围 绕 相 
同 概念 进行 提问 的 项 目 越 多 , 作 管 者 澄清 他 们 态度 或 展现 他 们 知识 的 机 会 就 越 多 , 那 项 测试 上 总 
分 的 信和 度 就 越 高 。 这 在 理论 上 讲 得 通 , 也 同样 从 数学 上 提高 了 信和 度 , 我们 可 以 从 计算 信 度 所 用 的 
公式 看 出 来 。 

回顾 前 面 的 a 系数 计算 公式 。 随 着 测试 长 度 增 加 ， 总 测试 分 数 的 变异 比 项 目 间 的 总 变异 增长 
得 更 快 。 在 公式 里 ， 这 意味 着 随 着 测试 变 长 ， 插 号 里 的 值 变 大 。n/n-1 部 分 同样 随 着 项 目 数量 增 
加 而 提高 。 所 以 ， 更 长 的 测试 往往 产生 更 高 的 信 度 估计 。 




















3.9.5 生效 原理 

相关 性 使 两 个 分 数 集 匹配 起 来 , 每 对 分 数 描述 一 个 个 体 。 如 果 多 数 人 表现 一 致 一 一 两 个 分 数 
都 高 或 都 低 , 或 者 和 其 他 人 对 比 都 是 平均 水 平 , 或 者 一 个 测试 的 高 分 与 男 一 个 测试 的 低 分 匹配 一 
致 ， 那 么 相关 性 会 接近 1.00 或 -1.00。 
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分 数 之 间 的 不 一 致 关 系 ， 产 生 一 个 接近 于 0 的 相关 。 分 数 的 一 致 性 ， 或 是 测试 和 其 自身 的 相 
关 , 在 经 典 测试 理论 [Hack #6] 建 立 的 标准 下 ,可 表明 分 数 是 可 信 的 。 经 典 测 试 理论 认为 , 除了 其 
他 方面 外 ， 随 机 误差 是 单 人 多 次 参加 相同 测试 而 分 数 发 生变 化 的 唯一 原因 。 
































3.10 建立 效 度 
2 一 项 测试 最 重要 的 特征 是 ， 它 对 预期 目的 有 用 。 如 果 要 证 明 测 试 分 获 代 表 了 预期 设 
定 的 意思 ， 那么 建立 效 度 是 非常 重要 的 。 如 果 你 可 以 提供 某 种 类 型 的 证 据 ， 那 么 能 
够 让 你 自己 和 其 他 人 相信 你 的 测试 是 有 效 的 。 


一 个 良好 的 测试 测量 它 打算 测量 的 事物 。 比 如 一 项 意图 找 出 高 中 生 系 汽车 安全 带 频 率 的 调 
查 , 很 明显 ,这 项 调查 应 该 包含 关于 安全 带 使 用 的 问题 。 一 个 没有 这 些 项 目的 调查 , 会 因为 没有 
效 度 而 受到 合理 批评 。 调 查 、 测 试 和 实验 都 需要 可 接受 的 效 度 。 如 果 你 正在 设计 一 项 心理 学 或 教 
育 测试 ， 或 只 是 想 确保 你 的 测试 是 有 用 的 ， 那 么 你 应 该 关心 效 度 的 建立 问题 。 

对 一 个 测试 而 言 ， 效 度 不 是 可 有 可 无 的 东西 。 效 度 是 由 测试 开发 人 员 、 那 些 关 心 测试 结果 的 
人 ， 以 及 任何 与 测试 及 测试 结果 利益 相关 的 人 共同 决定 的 。 

想 想 一 个 由 数学 问题 构成 的 拼写 测试 很 明显 , 数学 问题 构成 的 测试 不 是 一 个 有 效 的 拼写 测 
试 。 虽然 它 不 是 一 个 有 效 的 拼写 测试 , 但 它 可 能 是 一 个 有 效 的 数学 测试 。 测试 的 效 度 或 调查 的 效 
度 不 在 于 工具 本 身 ， 而 在 于 对 结果 的 解释 。 

一 项 测试 可 能 对 一 个 目的 有 效 , 但 对 为 一 个 目的 无 效 。 用 一 个 学 生 的 拼写 测试 分 数 来 解释 他 
的 数学 能 力 是 不 合适 的 。 这 个 分 数 也 许 作 为 对 语言 能 力 的 测量 是 有 效 的 ， 但 对 数字 流体 能 力 ” 
( fluidity ) 无 效 。 分 数 本 身 既 不 是 有 效 的 也 不 是 无 效 的 ， 与 分 数 关联 的 意义 才 是 有 效 或 无 效 的 。 

为 了 说 明 如 何 解决 建立 效 度 的 问题 , 想象 你 设计 了 一 种 测量 拼写 能 力 的 新 方法 。 你 想 要 把 测 
试 卖 给 全 国 的 学 校 , 但 首先 你 必须 拿 出 显而易见 的 证 据 , 证 明 你 的 测试 测量 的 是 拼写 能 力 ， 而 不 
是 其 他 内 容 ， 比 如 词汇 、 焦 虑 性 、 阅 读 能 力 或 是 〈 其 他 可 能 影响 分 数 的 因素 ) 性 别 或 种 族 。 































































































3.10.1 效 论 的 制胜 策略 

效 度 看 起 来 像 一 个 永远 无 法 获胜 的 辩论 , 因为 作为 一 个 不 可 见 的 质量 指标 , 它 永 远 无 法 完全 
建立 起 来 。 但 作为 一 名 测试 开发 人 员 , 你 希望 使 参 斌 人 员 以 及 任何 会 使 用 测试 结果 的 人 相信 ,你 
本 质 上 测量 的 就 是 你 想 要 测量 的 事物 。 幸 好 ， 有 很 多 可 行 方法 能 够 给 测试 提供 效 度 证 据 。 























注 5: 在 心理 学 的 智力 领域 , 美国 心理 学 家 卡特 尔 把 智力 分 成 流体 能 力 和 晶体 能 力 , 流体 能 力 是 人 的 一 种 潜在 能 力 ， 主 要 
和 神经 生理 的 结构 和 功能 有 关 , 很 少 受 社会 教育 影响 , 它 与 个 体 通过 遗传 获得 的 学 习 和 解决 问题 的 能 力 有 联系 。 昂 
体 智 力 则 主要 是 后 天 获得 的 ， 受 文化 背景 影响 很 大 ， 与 知识 经 验 的 积累 有 关 。 一 一 译 者 注 
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有 趣 的 是 ， 最 普遍 接受 的 效 度 类 型 在 理论 上 具有 最 弱 的 论据 。 这 种 论据 是 表面 效 度 的 一 种 ， 
它 是 这 样 的 : 测试 是 有 效 的 ， 因 为 它 看 起 来 (表面 上 ) 像 测量 了 它 想 要 测量 的 事物 。 那 些 提出 或 
接受 表面 效 度 论据 的 人 认为 , 在 这 个 测试 中 发 现 了 他 们 期 望 的 项 目 类 型 。 比 如 , 之 前 提 到 的 安全 
带 使 用 调查 ， 如 果 其 中 有 项 目 问 到 安全 带 使 用 ， 那 么 它 就 会 被 视 为 具有 效 度 。 


表面 效 度 论据 很 弱 ， 因 为 它 只 依赖 于 人 们 的 判断 ， 却 令 人 无 法 抗拒 。 在 说 服 某 人 完全 相信 并 
接受 一 个 评估 时 ,常识 是 一 个 很 强 的 论据 ,其 至 可 能 是 最 强 的 。 虽然 表面 效 度 看 起 来 没有 其 他 类 
型 的 效 度 那 么 具有 科学 性 ( 实际 上 ， 它 是 不 太 科学 的 )， 但 如 果 缺 少 表面 效 度 ， 那 些 编制 者 和 使 
用 者 几乎 不 会 接受 这 种 测试 工具 。 作 为 一 名 测试 开发 者 或 用 户 , 如 果 你 不 能 提供 本 Hack 后 面 讨论 
的 效 度 类 型 ， 那 么 你 应 该 提供 一 个 至 少 具有 表面 效 度 的 测试 。 


























A 对 于 你 的 拼写 测试 ， 如 果 参 试 者 被 问 到 拼写 问题 ， 就 说 明 你 已 经 建立 了 表面 效 度 。 
有 四 种 更 科学 的 效 度 证 据 , 被 那些 经 常 运 用 评估 的 人 普遍 接受 ,它们 都 属于 效 度 的 论据 范围 。 
@ 基于 内 容 的 论据 


测试 中 的 项 目 公 正 地 代表 了 能 在 这 个 测试 上 出 现 的 项 目 吗 ? 如 果 一 个 测试 想 要 覆盖 一 些 明 
确 界定 领域 的 知识 ， 那 么 问题 是 从 这 个 领域 公正 取样 的 吗 ? 


@ 基于 标准 的 论据 

测试 的 分 数 能 用 于 估计 其 他 类 似 测 试 的 表现 吗 ? 

@ 基于 结构 的 论据 

测试 的 分 数 代表 了 你 希望 测量 的 特质 吗 ? 

@ 基于 结果 的 论据 

参加 测试 的 人 受益 于 经 验 吗 ”测试 时 偏向 于 某 个 群体 吗 ? 参 加 测试 是 否 导致 太 多 的 压力 , 以 
至 于 不 管 分 数 如 何 ， 都 是 不 值得 的 ? 


3.10.2 ”基于 内 容 的 论据 


假设 你 决定 测量 一 个 概念 , 而 那个 概念 有 很 多 方面 ,并 且 在 一 个 测试 上 能 问 很 多 不 同 的 问题 。 
你 需要 证 明 为 测试 选择 的 项 目 代表 了 所 有 的 可 能 项 目 ， 这 种 证 明 就 是 对 效 度 基 于 内 容 的 论据 。 

这 听 起 来 像 一 个 令 人 旦 惧 的 需求 。 通 常 ， 人 们 认为 这 类 证 据 在 测量 成 就 时 更 加 重要 。 在 成 就 
领域 (如 医药 、 法 律 、 英 语 、 数 学 )， 有 非常 多 且 明 确 清 楚 的 领域 和 内 容 可 供 某 项 有 效 测试 取样 。 
同样 ,一 名 任课 教师 可 能 已 经 定义 了 一 项 测试 应 该 测量 的 一 系列 目标 或 内 容 范围 。 但 是 ， 当 测试 
行为 、 知 识 或 态度 这 些 领 域 时 ， 很 难 像 这 样 准确 定义 一 个 学 科 的 各 方面 。 因 此 ,作出 这 样 一 个 合 
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理论 据 是 困难 的 : 你 已 经 选择 出 了 一 些 问题 ， 它 们 能 代表 某 个 想象 的 所 有 可 能 问题 的 问题 池 。 


那么 ,在 测试 构建 中 ,对 效 度 的 内 容 证 据 而 言 ， 什 么 才 是 必须 的 ? 看 起 来 ， 至 少 需要 某 种 问 
题 选择 或 构建 的 组 织 方法 。 比 如 ， 当 测量 自尊 时 ,问题 可 能 涵盖 参 试 者 在 不 同 环境 中 的 自我 感觉 
如 何 ( 如 工作 场所 、 家 里 或 学 校 )， 同 时 还 有 不 同 任务 表现 ( 如 体育 、 学 术 或 工作 职责 ), 或 对 自 
己 不 同方 面 的 感觉 如 何 (如 外 表 、 智 力 或 社交 技能 )。 








对 于 一 名 测量 过 去 几 周 学 生 学 习 程 度 的 任课 教师 来 说 ,制定 一 张 规范 表 ( 包含 组 织 
好 的 主题 列表 并 表明 重要 性 ) 是 个 好 方法 。 
测试 开发 人 员 有 权 决 定 如 何 组 织 一 个 概念 或 如 何 将 这 个 概念 分 解 。 测 试 人 员 可 能 从 研究 或 其 
他 测试 中 获得 灵感 , 也 可 能 只 是 遵循 了 一 些 通用 模式 。 关键 是 要 说 服 自己 , 这 样 你 才能 说 服 他 人 ， 
让 他 们 相信 你 的 选择 覆盖 了 正 测量 事物 的 重要 方面 。 
对 于 你 的 拼写 测试 , 如 采 能 证 明 让 学 生 拼 写 的 单词 代表 了 学 生 应 该 掌握 的 更 大 的 单词 池 , 那 
你 就 是 在 提供 基于 内 容 的 效 度 证 据 。 



























































3.10.3 ”基于 标准 的 论据 


效 度 的 标准 证 据说 明 ， 一 个 测试 上 的 回答 能 预测 某 个 其 他 情境 下 的 表现 。“ 表 现 ” 可 以 是 工 
作 上 的 成 功 ， 测试 分 数 、 他 人 的 评价 ， 等 等 。 

如 果 测 试 上 的 回答 和 标准 表现 相关 , 且 这 个 标准 能 马上 测量 , 那么 这 个 效 度 证 据 叫 做 同时 效 
度 (concurrent validity )。 如 果 对 测试 的 响应 和 未 来 某 天 才能 被 测量 的 标准 表现 相关 ， 那么 这 个 效 
度 证 据 叫 做 预测 效 度 (predictive validity )。 


显而易见 , 你 选择 用 来 支持 标准 效 度 的 测量 应 该 具有 相关 性 , 测量 的 概念 应 该 与 标准 具有 或 
多 或 少 的 理论 相关 性 。 当 测试 的 明确 目的 是 估计 或 预测 在 茶 个 其 他 测量 上 的 表现 时 , 这 种 形式 的 
效 度 证 据 是 最 具 说 服 力 且 最 重要 的 。 

当 测 试 不 需 用 来 预测 未 来 或 估计 在 某 个 其 他 测量 上 的 表现 时 , 基于 标准 的 论据 就 不 那么 具有 
说 服 力 了 ， 也许 是 不 相关 的 。 比 如 ， 这 种 证 据 可 能 对 你 的 拼写 测试 没有 用 。 男 一 方面 ， 你 也 许可 
以 证 明 在 你 的 测试 中 得 到 高 分 的 人 ， 在 全 国 拼写 比赛 中 也 表现 良好 。 





























3.10.4 基于 结构 的 论据 

效 度 证 据 的 第 三 种 类 别 是 结构 证 据 。 结 构 ( 重音 在 第 一 个 音节 ，con-struct ) 是 一 个 测试 设计 
要 测量 的 理论 概念 或 特质 。 我 们 知道 永远 无 法 直接 测量 智力 或 自尊 等 的 结构 。 心 理 测量 的 方法 是 
间接 的 。 我 们 通过 问 一 系列 问题 , 希望 作答 者 使 用 我 们 正 测量 的 他 思维 的 一 部 分 , 或 参考 包含 过 
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去 行为 或 知识 信息 的 记忆 的 一 部 分 ， 或 者 ， 至 少 指引 作答 者 检验 他 在 某 个 特定 话题 上 的 态度 和 
情感 。 

我 们 进一步 希望 参 试 人 员 在 测试 项 目 上 准确 且 诚 实 作答 。 实际 上 , 测试 结果 总 是 被 当做 结构 
的 直接 测量 , 但 我 们 不 应 该 忘记 它们 只 是 有 根据 的 推测 。 整 个 过 程 的 成 功 依赖 于 另外 一 系列 假设 : 
我 们 已 经 正确 定义 好 了 我 们 试图 测量 的 事物 结构 ， 并 且 我 们 的 测试 也 反映 了 那个 定义 。 

那么 , 结构 证 据 总 是 包含 这 两 方面 : 对 所 定义 结构 本 身 的 辩护 和 对 使 用 工具 反映 了 定义 的 声 
明 。 展示 结构 效 度 的 论据 包含 这 样 一 个 论证 : 实际 的 反应 和 理论 预期 的 反应 一 致 。 结 构 效 度 在 每 
使 用 一 个 调查 或 测试 时 不 断 累 积 , 像 所 有 的 效 度 论据 一 样 , 它 永远 无 法 完全 令 人 信服 。 在 某 种 意 
义 上 ，, 结构 效 度 论据 包含 了 内 容 和 标准 效 度 论据 ,因为 所 有 效 度 论据 都 试图 建立 概念 和 测量 之 间 
的 联系 。 

对 于 你 的 拼写 测试 , 可 能 存在 对 拼写 能 力 本 质 的 研究 , 将 其 作为 认 知 活动 、 人格 特质 或 某 种 
其 他 明确 定义 的 实体 。 如 果 你 能 通过 拼写 能 力 定 义 你 的 意思 , 证 明 你 的 测试 分 数 和 定义 所 期 望 的 
一 致 , 那 你 就 拥有 了 基于 结构 的 效 度 证 据 。 理 论 认 为 阅读 能 力 好 的 人 拼写 能 力也 好 吗 ? 展示 那 种 
相关 ， 也 许 用 到 相关 系数 [Hack#lI1]， 这 样 你 就 已 经 呈现 了 可 能 说 服 别 人 的 效 度 证 据 。 















































3.10.5 ”基于 结果 的 论据 


在 10 年 或 20 年 之 前 , 对 建立 效 度 感 兴趣 的 测量 人 员 只 关心 如 何 证 明 测试 分 数 反映 结构 。 随 着 
人 们 开始 关注 一 些 测试 可 能 会 不 公平 地 使 整 组 人 处 于 不 利 地 位 ,加 上 担忧 测试 的 普遍 使 用 会 带 》 
社会 问题 ， 政 策 制定 者 和 测量 哲学 家 们 现在 开始 审视 参 试 者 因为 参加 测试 而 导致 的 后 果 。 

我 们 如 此 习惯 测试 并 基于 那些 分 数 进行 利益 依 关 的 决策 , 现在 我 们 应 该 偶尔 退 一 步 , 问 问 自 
己 ， 如 果 依 赖 测试 做 决策 ,社会 是 否 会 更 进步 。 从 代表 测试 结构 的 分 数 到 满足 预期 目的 测试 , 效 
度 的 含义 在 不 断 扩大 。 想 必 测 试 是 在 这 里 给 世界 提供 帮助 的 ,而 不 是 伤害 它 ， 基于 结果 的 效 度 证 
据 是 用 来 证 明 测 试 的 社会 价值 的 。 


























刀 就 像 十 老 笑话 中 政府 人 员 一样， 测试 是 “在 这 给 我 们 提供 帮助 的 "。 





对 于 你 的 拼写 测试 , 你 想 要 消除 的 核心 负面 影响 是 测试 偏差 。 如 有 果 你 的 拼写 能 力 理论 预期 性 
别 、 种 族 或 社会 经 济 地 位 之 间 没 有 差异 性 ， 那 么 拼写 分 数 在 这 些 组 间 应 该 相同 。 你 也 许可 以 用 t 
检验 [Hack #17]， 来 提供 组 间 分 数 相似 的 证 据 ， 这 样 就 很 好 地 证 明 测试 的 公平 性 和 有 效 性 。 


3.10.6 ”从 效 度 菜单 选项 里 选择 


这 里 描述 的 不 同 效 度 证 据 类 别 都 代表 一 个 策略 性 的 菜单 选项 。 如果 你 想 要 证 明 效 度 , 可 以 从 
这 些 不 同 的 效 度 证 据 类 型 中 选择 。 
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明显 地 , 不 是 所 有 的 测试 都 需要 提供 所 有 类 型 的 效 度 证 据 。 一 项 由 教师 为 25 个 学 生 编 制 的 小 
型 测试 , 可 能 只 需要 一 些 基于 内 容 的 效 度 证 据 来 说 服 教师 相信 测试 结果 。 基 于 标准 的 效 度 证 据 不 
是 必须 的 ， 因 为 估计 在 另 一 个 测试 上 的 表现 不 是 这 类 测试 的 预期 目的 。 

另 一 方面 ， 重 要 的 测试 ， 比 如 大 学 入学 测试 ( 像 ACT、SAT 和 GRE ) 和 智力 测试 ， 这 些 用 来 
确认 学 生 特殊 教育 基金 资格 的 测试 ， 应 该 得 到 四 个 效 度 的 证 据 支持 。 对 于 你 的 拼写 测试 ， 你 可 以 
自己 决定 提供 哪 种 类 型 的 证 据 、 哪 种 类 型 的 论据 是 最 有 说 服 力 的 。 






































J 3.11 预测 生命 周期 
由 #33 我 们 中 的 很 多 人 先 直 党 相信 ， 己 经 存在 很 长 时 间 的 事物 可 能 会 存在 更 长 的 时 间 ， 存在 
不 久 的 事物 ， 纺 续 存 在 的 时 间 也 不 长 。 这 种 图 其 的 形式 化 叫做 名 特 原 理 ( Gott's 
Principle )， 数 掌上 也 容易 证 明 。 





到 目前 为 止 ， 物 理学 家 理 查 德 ， 戈 特 三 世 (J Richard Gott II ) 已 经 成 功 地 预测 出 柏林 墙 的 
倒塌 ， 计 算出 44 大 道 百 老 汇 的 持续 时 间 。 具 有 和 争议 的 是 ， 他 预测 人 类 可 能 存在 的 时 间 介 于 5100 
年 至 780 万 年 之 间 ， 但 不 会 再 长 。 他 认为 这 是 创建 自给 自足 型 太空 殖民 地 的 一 个 很 好 理由 : 如 果 
人 类 把 卵 放 到 其 他 梨 里 , 也 许可 以 因此 使 其 避免 行星 撞击 或 星球 家 园 的 核 战 争 , 从 而 延长 我 们 种 
族 的 生命 周期 。 

戈 特 认为 他 的 简单 计算 在 某 些 参 数 范 
算 来 预测 茶 事物 的 存在 时 间 ， 你 需要 知道 

















围 内 ,能 够 被 运用 到 几乎 所 有 事物 上 。 为 了 使 用 这 些 计 
它 已 经 存在 了 多 长 时 间 。 





3.11.1 行动 起 来 


戈 特 的 计算 基于 他 所 谓 的 哥 白 尼 原 理 ( 在 这 个 特定 应 用 下 ， 有 些 人 将 其 称 作 戈 特 原理 )。 这 
个 原理 假定 ， 当 你 选择 某 个 时 刻 来 计算 某 个 现象 的 生命 周期 时 ,那个 时 刻 可 能 非常 普通 , 不 是 特 
别 的 或 是 享有 特权 的 ， 正 如 哥 白 尼 告 诉 我 们 地 球 在 宇宙 中 并 不 占据 特权 位 置 一 样 。 

在 普通 的 、 无 特权 的 时 刻 选 择 对 象 , 这 一 点 很 重要 。 选 择 你 认为 处 于 生命 周期 开始 或 结束 阶 
段 的 对 象 ， 比 如 住 在 新 生 儿 病房 或 疗养 所 的 人 , 会 让 你 的 测试 有 偏差 , 产生 糟糕 的 结果 。 进 一 步 
说 , 戈 特 原理 在 有 确切 数据 存在 的 情况 下 , 不 是 那么 有 用 。 由 于 已 经 有 了 大 量 关 于 人 类 生命 周期 
的 精确 数据 ， 所 以 戈 特 原 理 在 这 个 方面 也 不 是 那么 有 用 。 

假设 我 们 已 经 选 好 了 一 个 时 刻 , 现在 来 检验 它 。 在 其 他 所 有 条 件 都 一 样 的 情况 下 ， 这 个 时 刻 
处 于 这 个 现象 生命 周期 中 间 的 50%， 这 种 情况 发 生 的 几率 为 50%， 有 60% 的 几率 处 于 中 间 的 60%， 
有 95% 的 几率 处 于 中 间 的 95%， 以 此 类 推 。 因此， 只 有 25% 的 几率 你 选择 的 时 刻 在 前 1/4 的 生命 周 
期 里 ，20% 的 几率 在 前 /5 里 ，2.5% 的 几率 在 生命 周期 的 后 2.5% 里 ， 以 此 类 推 。 
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表 3-11 给 出 了 50% 、60% 和 95% 的 置信 区 间 的 方程 式 。tas 表 示 对 象 已 经 存在 的 时 间 ，tawee 代 
表 它 预计 还 能 存在 的 时 间 。 


表 3-11: 戈 特 原理 的 置信 水 平 





置信 水 平 最 小 机 ture 最 大 tiuture 
50% 3 3 
60% to 4 
95% ths/39 391pn 


让 我 们 看 一 个 简单 的 例子 。 请 快速 回答 : 从 现在 开始 算 起 , 你 认为 谁 的 作品 更 有 可 能 被 大 家 
再 听 上 50 年 ? 约翰. 塞 巴 斯 带 安 .巴赫 (Johann Sebastian Bach ) 还 是 布 兰 妮 . 斯 皮尔 斯 ( Britney 
Spers ) ?巴赫 的 第 一 部 作品 大 约 出 现在 1705 年 。 从 我 现在 写 书 的 时 间 看 ， 那 是 300 年 前 了 。 布 兰 
妮 的 第 一 张 专辑 在 1999 年 发 布 ， 大 约 是 6.5 年 前 或 79 个 月 前 。 


查询 表 3-10 9 对 60% 的 置信 区 间 9 我 们 看 到 taue 最 小 值 是 fasww4 ?9 最 大 值 是 4fpasto 


因为 布 兰 妮 音乐 的 as 是 79 个 月 , 所 以 有 60% 的 几率 ,继续 听 布 兰 妮 音 乐 的 时 间 介 于 79/4 个 月 
至 79 x 4 个 月 之 间 。 换 句 话 说， 我们 有 60% 信 心 说 ， 从 现在 ， 布 兰 妮 会 有 介 于 19.75 个 月 (1.6 年 ) 
至 316 个 月 ( 26.3 年 ) 的 文化 影响 力 。 







































































>60% 对 快速 估计 来 说 是 一 个 良好 的 置信 水 平 ， 不 仅 因 为 它 是 一 个 比 平均 要 好 的 几 
率 ， 还 由 于 1/4 和 4 容易 计算 。 


出 于 同样 的 原因 , 我 们 能 在 60% 的 置信 水 平 , 预期 从 现在 起 人 们 听 巴 赫 音 乐 的 时 间 介 于 300/4 
和 至 300 x 4 之 间 ， 或 者 说 75 年 至 1200 年 之 间 。 因 此 , 我 们 能 预测 ， 布 兰 妮 的 音乐 很 可 能 会 和 她 的 
粉丝 一 同 消亡 ， 而 巴赫 的 音乐 可 能 会 一 直 被 听 到 第 四 个 千 祠 年 。 








3.11.2 ”生效 原理 


假设 我 们 正在 研究 我 们 称 作 目标 的 某 个 对 象 的 生命 周期 。 正 如 看 到 的 那样 ,我 们 有 60% 的 几 
率 处 于 这 个 对 象 生命 周期 中 间 的 60% ( 如 图 3-4 所 示 )。 














现在 ? 现在 ? 
20% | 60% ， 20% 
a A 














图 3-4: 生命 周期 中 间 的 60% 


120 第 3 章 测量 世界 ( Hack #23~#34 ) 











如 果 我 们 处 于 中 间 60% 的 最 末端 , 那 我 们 就 是 在 图 3-4 中 标记 “现在 ”的 第 二 个 点 位 置 处 。 在 
这 个 点 上 ， 目 标 生命 周期 只 剩 下 20% ( 如 图 3-5 所 示 )， 意 味 着 fare 等 于 1/4 的 tas ( 80% )。 这 是 我 






































们 在 60% 置 信 水 平 预期 的 最 小 剩余 生命 周期 。 
现在 
证 
80% ， 20% 
Lpast Truture 
\ 人 








Truture Tpast 。 4 











图 3-5: 最 小 剩余 生命 周期 (60% 置 信 水 平 ) 

相似 地 ， 如 果 我 们 处 于 图 3-4 里 中 间 60% 的 开始 之 处 〈 标 记 “ 现 在 ”的 第 一 个 点 )， 那 么 未 来 
还 有 80% 的 目标 生存 期 ， 如 图 3-6 所 示 。 因 此 ，tiwwre( 80% ) 等 于 4 x tas (20% )。 这 是 我 们 处 于 目 
前 置信 水 平 预 期 的 最 小 大 生命 周期 。 








80% 


1 future 








Truture fpast * 4 











图 3-6: 最 大 剩余 生命 周期 (60% 置 信 水 平 ) 
为 位 于 这 两 点 之 间 的 几率 有 60%， 所 以 我 们 能 以 60% 的 信心 算出 目标 未 来 的 持续 时 间 介 于 


tpast/ 4~4 Xx fpasto 


3.11.3 ”现实 应 用 


假设 你 想 要 投资 一 家 公司 ， 并 且 想 估计 这 家 公司 会 存活 多 久 以 判断 这 是 否 是 一 个 好 的 投资 。 
你 能 使 用 戈 特 原理 。 让 我 们 以 这 本 书 的 出 版 商 O’Reilly Media 为 例 ， 虽 然 它 没有 上 市 。 














我 当然 不 是 随机 选择 O?Reilly Media 的 ， 关 于 公司 能 持续 多 久 有 丰富 的 历史 信息 ， 
ww 但 是 让 我 们 至 少 尝试 把 贡 特 原理 作为 对 O’Reilly 寿 命 的 一 个 简易 估计 。 毕 竟 ， 对 于 
百老汇 演出 的 寿命 可 能 有 很 好 的 数据 ,但 是 咏 特 并 不 展 惧 分 析 它 们 。 所 以 我 不 会 说 
现在 O'Reilly 已 经 出 版 了 Mind Performance Hacks， 它 的 不 朽 是 肯定 的 。 
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由 维基 百科 得 知 ，O?Reilly 作 为 一 家 从 事 技 术 写作 的 咨询 公司 ， 始 于 1978 年 。 我 写作 此 书 的 
时 间 为 2005 年 7 月 ， 所 以 OReilly 作 为 一 家 公司 已 经 存在 了 大 约 27 年 的 时 间 。 我 们 预计 O’Reilly 还 
将 存活 多 久 ? 

下 面 是 O'Reilly 可 能 的 生命 周期 ， 置 信 水 平 为 530%: 


e@ 最 小 





27/3=9 年 ( 到 2014 年 7 月 ) 

。 最 大 

27x3=81 年 (到 2086 年 7 月 ) 
下 面 是 置信 水 平 为 60% 时 的 生命 周期 预期 : 
。 最 小 

27/4=6 年 零 9 个 月 ( 到 2012 年 4 月 ) 

。 最 大 

27 x 4=108 年 ( 到 2113 年 7 月 ) 
最 后 ， 和 置信 水 平 为 95% 时 的 生命 周期 预测 : 


e@ 最 小 





27/39=0.69 年 = 大 约 8 个 月 零 1 周 〈 到 2006 年 3 月 中 名 ) 
@ 最 大 





27 x 39=1053 年 ( 到 3058 年 7 月 ) 
在 互联 网 经 济 时 代 ， 这些 数字 看 起 来 相当 不 错 。 例 如 ， 苹果 公 司 好 不 到 哪儿 去 ,微软 成 立 于 
1975 年 ， 所 以 我 们 同样 可 以 这 么 说 微软 。 一 个 真正 的 投资 者 会 考虑 很 多 其 他 因素 ， 比 如 年 收益 和 
股票 价格 ， 但 初 看 之 下 ， 好 像 O'Reilly 至 少 会 在 下 个 十 年 比 一 个 假设 的 投资 者 活 得 更 长 。 


3.11.4 “人 参阅 


口 Ferris, Timothy. “How to Predict Everything.”7The New Yorker, July 12, 1999. ( 中 文书 名 《 纽 
约 客 》 1999 年 7 月 12 日 出 版 。) 

口 Gott, J. Richard III.“Implications of the Copernican Principle for Our Future Prospects.” Nature, 
363, May 27, 1993，(《 自然》 杂志 ，1993 年 5 月 27 日 版 。) 

口 Gott, J. Richard II.“A Grim Reckoning.” http://pthbb.org/manual/services/grim. 
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医学 检测 提供 约 诊断 幅 别 信息 总 是 容易 被 病人 误解 ， 有 时候 ， 医 生 甚 至 也 会 误解 。 理 
解 “ 敏 总 性 ”和 “特异 性 ”的 概率 特征 能 提供 更 加 准确 和 更 安心 ( 有 时 候 ) 的 概览 。 


作为 一 名 医学 信息 的 消费 者 ,你 必须 对 行动 、 治 疗 和 再 找 名 大 夫 寻 求 第 二 意见 你 
可 能 会 依赖 于 药物 信息 一 一 新 闻 故 事 、 你 医生 的 建议 、 检 测 结 果 ， 来 做 这 些 决 定 。 但是, 你 从 医 
生 那 获得 的 大 多 数 药物 信息 , 都 有 一 个 已 知 的 误差 量 。 这 对 指出 你 患 某 种 疾病 的 概率 的 诊断 检测 
结果 来 说 ， 尤 为 正确 。 


本 Hack 讲 解 使 用 医学 检测 的 特征 信息 来 获得 更 准确 的 事实 ， 以 期 能 对 治疗 作出 更 好 的 决策 。 


Ew 3.12 作出 明智 的 用 药 决定 
i 园 ， , 
































3.12.1 ”统计 和 药物 甄别 


为 了 明智 地 使 用 医学 检测 信息 , 我 们 必须 掌握 一 些 概念 的 准确 意义 。 用 准确 性 的 语言 表述 医 
学 检测 的 四 种 可 能 结果 ， 如 表 3-12 所 示 。 





表 3-12: 医学 检测 的 可 能 结果 











患者 真 患 病 (A) 患者 实际 没 患 病 (B) 
仁 测 结果 显示 患者 患 病 真 阳性 ( 分 数 是 正确 的 ) 假 阳性 〈 分数 是 错误 的 ) 
检测 结果 显示 患者 没 患 病 假 明 性 (分数 是 错误 的 ) 真 阳 性 ( 分 数 是 正确 的 ) 





医学 筛 查 检测 的 信和 度 [Hack#6] 被 概括 为 敏感 性 和 特异 性 的 这 两 个 比例 。 本 质 上 说 , 依赖 这 些 
检测 结果 做 决策 的 人 ， 关 心 有 关 准确 性 的 三 个 问题 


如 果 一 个 人 患 有 疾病 ， 这 个 人 得 到 阳性 试验 结果 的 可 能 性 是 多 少 ? 这 种 可 能 性 称 作 敏感 性 。 
在 A 列 中 的 那些 人 ， 得 到 阳性 试验 结果 的 概率 是 多 少 ? 


如 果 这 个 人 没 患 病 ， 那 这 个 人 的 检测 结果 为 阴性 的 可 能 性 是 多 少 ? 这 种 可 能 性 称 作 特异 性 。 
在 B 列 中 的 那些 人 ， 检 测 结果 为 阴性 的 比例 有 多 大 ? 


如 果 一 个 人 的 检测 结果 为 阳性 , 那 这 个 人 患 病 的 可 能 性 是 多 少 ? 从 病人 角度 看 , 这 是 一 个 终 






































极 问题 ， 这 个 问题 可 以 被 认为 是 这 类 检测 关心 的 基本 效 度 。 医 生 , 我 能 够 相信 这 类 检测 结果 吗 ? 
还 是 说 检测 结果 有 错误 ? 





注意 在 表 3-12 中 ，A 列 和 B 列 是 不 同 的 人 。 患 病 的 人 是 在 A 列 ， 未 患 病 的 人 在 B 列 。 
果 你 在 A 列 ， 你 在 检测 中 不 能 得 到 假 阳性 的 结果 ， 因 为 阳性 结果 是 正确 的 。 如 果 
ee 你 在 检测 中 不 能 得 到 假 阴 性 的 结果 ， 因 为 阴性 结果 是 正确 的 。 


某 人 处 于 哪 一 列 取决 于 疾病 的 自然 分 布 。 茶 人 在 A 列 的 几率 〈 这 个 人 实际 上 患 有 该 疾病 的 几 
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率 ) 取决 于 疾病 的 基础 概率 (baserate )。 如 果 总 人 口中 有 5$% 的 人 患 有 该 疾病 ,那么 就 有 5% 的 人 
在 A 列 中 。 


3.12.2 ”理解 乳腺 瘤 筛 查 
乳腺 癌 是 可 以 进行 诊断 筛 查 检 测 的 一 种 严重 病情 。 乳 腺 癌 租 查 先 从 乳房 X 线 检测 开始 。 如 果 
X 线 检测 结果 是 阳性 ， 则 需要 进一步 检查 : 再 一 次 做 乳房 X 线 检测 、 超 声波 或 组 织 检查 。 
我 们 首先 对 回答 乳腺 瘤 得 查 的 敏感 性 和 特异 性 的 问题 感 兴趣 。 通 过 乳腺 癌 的 基础 概率 信息 ， 
我 们 能 回答 最 重要 的 问题 : 
如 果 一 名 女性 获得 一 个 阳性 结果 ， 她 患 有 乳腺 癌 的 可 能 性 是 多 大 ? 


通过 咨询 你 的 医生 或 做 一 些 研 究 ， 你 也 许 会 发 现 乳房 X 线 的 敏感 性 大 约 是 90%。 特 异性 大 约 
是 92%。 











”因为 有 不 同 的 人 参加 这 项 检测 , 乳腺 癌 筛 查 的 准确 敏感 性 和 特异 性 随 着 时 间 推 移 而 
:en 
感性 和 特异 性 都 不 如 年 龄 大 的 女性 。 当 然 ， 你 应 该 和 一 名 内 科 医 生 或 专家 核对 目前 

的 准确 性 水 平 。 


表 3-13 按 照 表 3-12 的 布局 呈现 了 那些 数据 。 因 为 A 列 和 B 列 必须 相互 独立 ， 总 和 为 100%， 我 
们 同样 能 估计 假 阴 性 和 假 阳性 的 比率 。 


表 3-13: 10 000 名 女性 的 乳房 X 线 检查 的 理论 结果 








实际 患 乳腺 癌 的 病人 A) N=120 实际 未 患 乳腺 癌 的 病人 (B) N=9880 
X 光 检查 显示 癌症 敏感 性 90%，N=108 假 阳 性 8%，N=790 
X 光 检查 未 显示 癌症 假 阴 性 10%，N=12 特异 性 92%，N =9090 





表 3-13 同 样 基于 总 体 中 大 约 1.2% 乳 . 腺 癌 的 基础 比率 ， 展示 了 10 000 名 女性 的 假设 结 


由 于 可 以 通过 不 同方 式 定义 相关 总 体 ， 所 以 很 难 确认 乳腺 癌 的 准确 发 病 率 ， 当 然 ， 
还 受 乳 腺 癌 检 测 结 果 准 确 性 的 限制 。 我 使 用 的 是 目前 针对 40 岁 至 84 岁 至 性 ,经常 报道 
和 被 广泛 接受 的 患 乳腺 癌 百 分 比 的 估计 。 


在 解释 医学 检测 结果 前 ， 我 们 先 回 到 重要 问题 列表 的 第 三 个 问题 。 如 果 一 个 人 的 检测 结果 为 
阳性 ， 这 个 人 患 病 的 可 能 性 是 多 少 ? 10 000 个 进行 乳腺 癌 筛 查 的 女性 中 ， 有 898 人 的 结果 为 阳性 。 
这 898 人 中 ，790 个 人 的 结果 是 错误 的 ， 她 们 实际 上 并 没有 乳腺 癌 。898 人 中 ， 有 108 个 人 的 检测 结 
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果 是 正确 的 ， 她 们 的 确 患 有 乳腺 瘤 。 换 句 话 说， 如果 一 个 人 的 结果 为 阳性 ， 那 么 她 只 有 12% 的 可 
能 性 患 病 。 对 于 定期 进行 X 光 检查 ， 结 果 为 阳性 ， 最 常见 的 结果 是 : 病人 实际 上 并 无 癌症 。 

那么 阴性 结果 的 准确 性 如 何 呢 ? 在 9102 和 名 得 查获 得 阴性 结果 的 女性 中 , 有 12 个 人 实际 患 有 瘤 
证 。 这 是 一 个 相对 较 小 的 数字 ，1% 的 1/10， 但 是 检测 会 完全 忽略 掉 这 些 人 ， 他 们 不 会 得 到 治疗 。 
































3.12.3 ”生效 原理 

托马斯 贝 叶 斯 ( Thomas Bayes ) 是 18 志 纪 的 哲学 家 和 数学 家 。 医 学 筛 查 准 确 性 ， 是 使 用 了 
托马斯 贝 叶 斯 条 件 概率 的 泛 化 方法 的 一 个 具体 应 用 。“ 如 果 这 样 ， 那么 ……… 的 几率 是 多 少 ”， 这 
是 一 个 条 件 概 率 问 题 。 

贝 叶 斯 的 条 件 概率 方法 是 , 看 事件 发 生 的 自然 概率 。 如 果 某 人 的 检测 结果 为 阳性 , 那么 估算 
他 患 病 几 率 的 基本 公式 是 : 



















































































真 阳性 
真 阳 性 + 假 阳 性 


果 以 条 件 概率 来 表述 ， 公 式 如 下 : 
基础 概率 x 敏感 性 
(基础 概率 x 敏感 性 )+(1- 基 础 概率 )(1- 特 异性 ) 
要 回 管 我 们 乳腺 癌 例 子 中 的 重要 问题 (“ 如 果 一 个 女人 的 检测 结果 为 阳性 ， 她 患 乳 腺 瘤 的 可 
能 性 是 多 少 ”)， 用 乳房 X 光 检查 的 公式 套用 这 些 值 : 


0.012x0.90 
(0.012x0.90)+(1-0.012)(1-0.92) 





‘T=, 






































=0.1202 





3.12.4 作出 明智 的 决策 


医学 检测 用 来 表明 患者 是 否 可 能 患 病 或 处 于 即将 患 病 的 危险 之 中 。 识别 疾病 ( 比如 癌症 ) 是 
和 否 存在 的 过 程 如 下 。 通 常 至 少 有 两 个 步骤 ,第 一 步 对 患者 进行 得 查 检测 ， 一 般 是 相对 简单 和 无 创 
伤 性 的 检测 ， 用 来 寻找 一 个 人 可 能 患 某 种 疾病 的 迹象 。 如 果 结 果 是 阳性 ,， 则 第 二 步 进 行 第 二 次 检 
测 (或 一 系列 的 检测 )， 这 通常 更 复杂 ， 具 有 创伤 性 ， 并 且 价 格 昂贵 ， 而 且 也 更 加 精确 ， 以 确认 
或 驳斥 原来 的 结果 。 

医学 检测 不 是 完全 可 靠 和 有 效 的。 检测 结果 可 能 是 错 的 。 接 受过 医学 检测 的 人 有 四 种 可 能 的 
结果 。 病 人 可 能 患 病 , 并且 检 测 也 表明 了 这 一 点 , 或 者 病人 没有 患 病 ,检测 也 没有 发 现 疾病 的 存 
在 。 在 这 些 情况 下 ,检测 起 到 作用 并 且 分 数 是 有 效 的 。 反之, 检测 结果 可 能 反映 了 真实 身体 状况 
的 相反 情况 , 用 一 个 阳性 的 结果 错误 地 指示 患 有 本 不 存在 的 疾病 , 或 者 用 一 个 阴性 的 结果 错误 地 
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指示 该 患者 没 患 病 。 在 这 种 情况 下 ,检测 没 起 作用 ， 其 结果 是 无 效 的 。 这 种 结果 的 表格 ， 类 似 于 
在 统计 决策 中 接受 或 拒绝 假说 的 概率 [Hack #4]。 

当 某 人 患 有 乳腺 癌 时 ,乳腺 瘤 筛 查 非常 容易 发 现 这 种 疾 。 然 而 , 这样 一 个 针对 低 发 病 率 的 疾 
病人 敏感 检测 有 一 个 缺点 : 更 多 的 人 将 被 告知 她 们 可 能 得 了 这 种 病 , 但 实际 上 她 们 并 没有 得 。 在 医 
学 检测 的 检测 敏感 性 和 检测 特异 性 之 间 有 一 个 折衷 。 更 敏感 检测 往往 会 导致 更 多 的 假 阳 性 , 但 在 
生死 侯 关 的 严重 病情 下 ， 这 似乎 是 一 个 我 们 能 够 接受 的 结果 。 





3.12.5 参阅 


Gigerenzer, G. (2002). Calculated risks. How to know when numbers deceive you. New York: Simon 


and Schuster. 
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逆境 制胜 
( Hack #35~#49 ) 





当 你 冒险 时 , 为 什么 要 承担 不 必要 的 风险 呢 ” 赌 场 游戏 需要 你 冒 点 险 , 但 本 章 的 真实 世界 统 
计 Hack 将 帮助 你 保持 自身 优势 ， 也 许 甚至 能 帮 你 克服 赌场 优势 。 

我 们 先 从 得 州 扑克 [Hack #36]( 听 说 过 吧 ) 开 始 。 然 后 是 扑克 [Hack #37] 和 概率 游戏 [Hack #38]。 

当然 , 无 论 你 玩 什么 ,请 确保 总 是 明智 地 下 注 [Hack #35]。 虽然 当 谈 到 你 所 冒 风 险 的 水 平时 ， 
有 些 游戏 [Hack #39 和 Hack #40] 比 其 他 游戏 要 好 [Hack #41]。 

如 果 你 想 和 好 友 进 行 友好 下 注 或 与 陌生 人 进行 陌生 下 注 , 可 以 使 用 统计 的 威力 来 赢得 一 些 令 
人 惊讶 的 赌局 ， 可 以 用 扑克 [Hack 夫 2 和 Hack 灼 4]、 般 子 [Hack 灼 3]， 或 几乎 任何 你 能 想到 的 东西 
[Hack #6]， 甚 至 包括 你 朋友 的 生日 [Hack #45]。 

说 到 怪异 的 赌博 游戏 (我 认为 我 们 也 很 怪异 )， 玩 这 些 游戏 时 ， 哪 怕 只 是 抛 硬币 [Hack #48]， 
你 都 需要 知道 一 些 奇 怪 的 统计 怪癖 [Hack #47 和 Hack #49]。 



























































WR 4.1 明智 地 下 注 
,35 不 管 是 什么 游戏 ,如 果 涉 及 金钱 和 几率 , 就 有 一 些 基本 的 赌博 真相 ,而 这 可 以 才 助 三 
福 的 贷 计 学 家 保持 快乐。 
虽然 本 章 都 是 针对 特定 游戏 的 Hack, 其 中 大 多 数 游戏 是 几率 游戏 , 但 也 有 各 种 各 样 的 对 所 有 
赌 徒 通用 的 技巧 和 工具 。 太 多 的 神秘 、 迷 信 、 数 学 方面 的 困惑 充斥 着 赌博 世界 ， 了 解 赌博 世界 的 
地 形 可 以 帮助 你 行走 自如 。 这 个 技巧 通过 教 你 下 面 的 事情 ， 来 展示 如 何 更 明智 地 下 注 。 
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口 赌 徒 廖 误 ， 一 个 直观 但 虚假 的 信仰 体系 ， 除 了 见 多 识 广 的 玩家 ， 很 多 玩家 都 为 此 花 了 不 
少 钱 。 

口 赌场 和 人 金钱。 

口 系统 、 复 杂 的 资金 管理 和 无 效 的 投注 方法 。 














4.1.1 赌 徒 廖 误 


你 是 否 有 过 这 种 经 历 : 玩 21 点 时 ,你 连续 抽 到 很 多 把 差 牌 ,由 于 你 知道 这 种 局 面 将 会 随时 改 
变 ， 所 以 你 增加 了 赌注 。 如 果 是 这 样 , 那 你 就 是 届 服 于 赌 徒 座 误 ， 它 是 这 样 一 种 信念 : 从 长 远 来 
看 ， 因 为 有 某 种 预期 概率 ， 短 期 连续 的 坏 运 气 可 能 会 迅速 改变 。 

赌 徒 泌 误 ， 是 一 个 几率 的 游 摆 ， 它 在 坏 结果 的 区 域 氛 动 一 会 儿 ， 失 去 动力 ,然后 摆 回 好 结 
的 区 域 , 在 其 中 摆动 一 会 儿 。 这 种 心态 的 问题 是 : 和 在 靠 运气 的 纯 几 率 游戏 中 一 样 ， 运 气 是 一 系 
列 的 独立 事件 , 每 个 人 的 结果 和 它 之 前 的 结果 无 天 。 换 句 话 说 ,在 好 区 域 位 置 摆动 或 是 在 坏 区 域 









































在 可 能 的 结果 之 间 随 机 弹 取 ，, 并且 出 现任 何 结果 的 概率 和 每 个 结果 相关 。 没 有 推动 力 ( 也 看 不 出 
发 展 趋势 )， 这 个 真相 经 常 被 概括 为 “ 贫 子 没有 记忆 "。 
与 赌 徒 诬 误 信念 一 致 的 例子 有 下 面 这 些 : 
口 一 个 一 段 时 间 内 都 没有 叶子 的 老虎 机 要 叶子 了 ，; 
口 一 名 整 夜 坏 手气 的 扑克 玩家 ， 很 快 就 会 得 到 一 个 超级 大 手 ， 使 局 面 逆转 ; 
口 前 3 场 比赛 均 失败 的 棒球 队 更 容易 赢得 第 四 场 比赛 ; 
口 因为 掷 贷 子 时 不 太 可 能 连续 获得 3 个 7， 所 以 掷 出 3 个 7 后 ， 想 马上 再 掷 得 第 四 个 7 基本 是 不 
可 能 的 ; 
口 一 个 轮 盘 球 已 经 连续 8 次 落 在 红色 数字 上 ， 下 次 几乎 一 定 会 落 在 黑色 数字 上 。 
如 果 能 竭尽 全 力 地 避免 这 种 诬 误 ， 那 么 赌博 应 该 会 让 你 少 花 一 点 钱 。 























4.1.2 ”赌场 和 金钱 


赌场 赚钱 。 赌 场 赚 取 利 润 的 一 个 原因 是 , 游戏 本 身 赢得 的 金额 比 公 平 情况 下 赢得 的 金额 略 少 。 
在 一 个 几率 游戏 中 ， 一 个 公平 的 彩 金 让 双方 参与 者 ( 赌场 和 玩家 )， 从 长 远 来 看 都 收 支 平 衡 。 

一 个 公平 彩 金 的 例子 是 ,赌场 使 用 只 有 36 个 数字 的 轮 盘 , 一 半 红 色 一 半 黑 色 。 命中 一 个 红色 
数字 后 ,赌场 会 将 那些 押 注 红色 的 玩家 的 赌注 增加 一 倍 。 有 一 半 的 时 间 赌 场 会 赢 ， 有 一 半 的 时 间 
玩家 会 说 。 实 际 上 ， 美 国 赌场 使 用 38 个 数字 ， 其 中 有 两 个 既 不 是 红色 也 不 是 黑色 。 这 使 赌场 相对 
于 公平 的 彩 金 有 2/38 的 优势 。 当 然 ， 赌 场 通过 这 种 方式 赚钱 ， 从 一 般 意义 上 来 说 ， 这 是 公平 的 ， 
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赌 秆 和 赌场 都 希望 这 样 ， 它 是 财 徒 与 赌场 社会 契约 的 一 部 分 。 不 过 ， 


个 优势 赚钱 ， 那 么 没有 人 愿意 继续 经 营 








[e) 





事实 是 ， 如 果 赌 场 仅 依靠 这 


赌场 赚钱 的 第 二 个 原因 是 ， 赌 徒 没有 取 之 不 尽 的 赌 本 ,他 们 不 会 无 休 无 止 地 赌 下 去 。 比 如 轮 

















盘 赌 ， 赌 场 优势 是 5.26%， 这 是 一 个 赌 徒 赌 无 数 次 ， 赌 场 能 赚 














儿 赚 钱 ， 一 会 儿 亏 钱 。 在 任何 给 定 的 时 间 ， 平 均 来 说 ，{ 





























到 的 钱 。 这 个 赌 无 限 次 的 赌 徒 一 会 
也 的 赌 金 都 将 比 开 始 时 少 5.26%。 


虽然 现实 生活 中 真实 情况 是 , 大 多 数 玩家 通常 会 在 用 完 筹码 后 的 某 个 时 间 不 玩 了 。 大 多 数 玩 
家 有 钱 时 继续 投注 ， 没 钱 时 停止 下 注 。 当 然 ， 有 些 玩家 赚钱 时 会 选择 离开 。 但 是 ， 





钱 ( 没 信用 卡 ) 时 还 下 注 。 


























没有 玩家 在 没 


试想 一 下 ， 表 4-1 代 表 任 何 赌场 游戏 的 1000 名 玩家 。 所 有 玩家 一 开始 都 有 100 美 元 ,打算 玩 一 
然 其 他 游戏 有 更 高 或 更 低 的 


晚上 (4 小 时 )。 我 们 假设 赌场 有 5.26% 的 优势 ， 就 像 轮 盘 赌 一 样 ， 虽 


优势 。 


表 4-1: 1000 名 假想 赌 徒 的 命运 








赌博 时 间 剩余 赌 金 平均 剩余 赌 金 输 掉 的 赌 金 还 在 玩 
玩 1 小 时 后 900 94.74 美 元 100 900 
玩 2 小 时 后 800 94.74 美 元 200 800 
玩 3 个 小 时 后 700 94.74 美 元 300 700 
玩 4 个 小 时 后 600 94.74 美 元 400 600 








在 这 个 例子 中 ， 虽 然 使 用 的 是 虚构 数据 ， 但 我 敢 打赌 ， 这 是 保守 的 数据 








仍然 有 56 844 美 元 ， 赌 场 有 43 156 美 元 ， 
的 5.26% 的 优势 要 高 。 





4 小 时 后 ， 玩 家 


从 可 用 资金 总 量 来 看 ， 赌 场 拿 了 43.16%。 这 上 比 赌 场 官方 








玩家 继续 玩 下 去 的 倾向 是 人 类 行为 ,而 不 是 和 特定 游戏 相关 联 的 概率 , 这 种 行为 使 赌场 能 够 





场 优势 。 











通过 赌博 获 利 。 因 为 赌场 的 规则 被 发 布 和 报道 出 来 , 所 以 统计 学 家 可 以 为 任何 特定 的 游戏 算出 赌 


但 是 , 没 人 要 求 赌 场 报告 他 们 从 桌 上 游戏 赢得 的 具体 金额 但 是 , 根据 内 华 达 ( 我 最 喜爱 的 
赌场 赚 得 不 少 。 这 里 一 般 赌 








赌场 ) 劳 克 林 ( Laughlin ) Lum 旅 游 酒店 里 粗毛 地 毯 的 厚度 ， 我 猜测 
徒 的 Hack 是 过 一 段 时 间 后 走 开 , 不 管 你 是 领先 还 是 落后 。 如 曙 








遥 领 先 ， 那 么 考虑 走出 赌场 。 


4.1.3 ”系统 


基于 资金 管理 和 改变 标准 赌注 数量 
增加 赌注 ， 当 然 也 有 些 系统 建议 赢得 一 



































你 在 时 间 耗 尽 前 足够 幸运 , 外 


6 够 还 


， 有 几 种 不 同 的 投注 系统 。 一 般 系 统 建议 在 输 掉 一 局 后 ， 








局 后 ,增加 赌注 。 由 于 所 有 这 些 系统 假设 连 胜 或 连 败 ,过 
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热 或 过 冷 ， 总 是 更 可 能 终止 而 不 是 继续 ， 所 以 多 少 有 点 基于 赌 徒 雇 误 。 但 是 ， 即 使 这 样 的 系统 具 
有 数学 意义 ,任何 时 间 下 注 者 必须 增加 投注 ,一 直到 玩家 获胜 ， 从 长 远 看 ， 有 限 口袋 大 小 定律 破 
坏 了 系统 。 


这 里 有 一 个 真实 的 故事 。 我 年 轻 时 , 第 一 次 去 一 个 合法 赌博 场所 ,我 急于 使 用 自己 设计 的 系 
统 。 我 注意 到 ， 如 果 我 在 轮 盘 赌 中 对 12 个 数字 下 注 ， 赔 率 是 2 : 1。 也 就 是 说 ， 如 果 我 赌 10 美 元 而 
且 赢 了 ， 除 了 能 拿 回 10 美 元 本 金 外 ,还 能 赢得 额外 的 20 美 元 。 当 然 ,， 这 12 个 数字 中 任意 一 个 出 现 
的 几率 都 不 大 ， 但 如 果 我 赌 两 组 12 个 数字 ,那么 我 的 胜算 就 大 了 。 我 有 24/36 ( 好 吧 ， 其 实 是 38 ) 
的 可 能 性 会 赢 一 一 几率 超过 50%1! 

当然 ， 我 明白 ， 我 无 法 通过 投注 两 组 数字 赢得 3 倍 的 钱 。 毕 竟 ， 对 于 没有 转 到 那 12 个 数字 的 
一 组 ， 我 将 失去 一 半 的 赌注 。 我 明白 如 果 我 下 注 20 美 元 ， 约 2/3 的 时 间 我 会 赢 回 30 美 元 。 这 将 有 
10 美 元 的 利润 。 此 外 ， 如 果 转 盘 第 一 转 我 没有 赢 ， 我 会 再 次 赌 上 相同 的 号 码 , 但 这 次 我 将 赌注 加 
倍 ! (我 是 一 个 超级 天 才 ,， 你 同意 吗 ? ) 如 果 我 在 第 二 转 中 也 输 了 ( 可 能 性 很 小 )， 我 会 再 一 次 将 
我 的 赌注 加 倍 ， 然 后 赢 回 我 所 有 的 钱 ， 再 加 上 50% 的 利润 。 总 之 ， 我 就 照 计 划 做 了 ,在 三 次 转盘 
中 都 输 了 ， 所 以 没 钱 度 过 漫长 的 周末 ， 也 没 钱 坐 22 小 时 的 车 回 家 。 

这 种 系统 最 简单 的 形式 是 在 你 每 次 赌 输 后 将 赌注 加 倍 , 然后 当 你 赢 ( 你 一 定 会 赢 的 ) 的 时 候 ， 
你 就 扳 回 了 一 点 。 问 题 是 ， 连 续 输 的 情况 很 常见 ， 这 些 都 是 几率 的 正常 波动 。 在 连 输 的 过 程 中 ， 
不 断 将 赌注 加 倍 迅速 用 光 了 你 的 赌 金 。 

表 4-2 给 出 了 连 输 6 轮 、 每 输 一 次 赌注 加 倍 的 结果 , 这 种 情况 经 常 发 生 在 21 点 、 轮 盘 赌 、 般 子 、 
视频 扑克 等 游戏 中 。 






























































表 4-2: “ 赌 输 后 赌注 翻 倍 ” 系 统 








输 的 次 数 赌注 大 小 总 支出 
1 5 美元 5 美元 

2 10 美 元 15 美 元 
3 20 美 元 35 美 元 
4 40 美 元 75 美 元 
5 80 美 元 155 美 元 
6 160 美 元 315 美 元 








连续 输 6 次 ， 即 使 是 在 输赢 可 能 性 几乎 一 样 的 游戏 里 ， 如 赌 轮 盘 赌 的 颜色 ， 如 果 你 玩 的 时 间 
不 只 是 一 两 个 小 时 ， 这 很 可 能 发 生 在 你 身上 。 在 一 次 试验 中 ， 财 输 的 实际 几率 是 52.6% (20 个 输 
的 结果 除 以 38 个 可 能 结果 )。 对 于 任意 连续 6 次 转盘 ,玩家 全 部 输 掉 的 几率 是 2.11% (0.526 x 0.526 
x 0.526 x 0.526 x 0.526 x 0.526 )。 
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试想 一 下 ， 两 个 小 时 内 玩 100 转 。 玩 家 预计 可 以 出 现 两 次 六 连 败 。 那 么 ， 一 般 情况， 在 此 系 
统 下 ， 玩 家 被 迫 下 注 的 金额 是 原始 赌注 的 32 倍 ， 只 为 赢得 等 于 原 赌注 的 金额 。 当 然 ， 大 部 分 时 候 
( 52.6% )， 出 现 连续 六 次 失败 后 ， 就 有 连续 第 七 次 的 失败 。 

帮助 玩家 在 赌博 游戏 中 作出 明智 战略 决策 的 系统 确实 存在 ， 如 21 点 ( 算 牌 ) 和 扑克 ( 看穿 你 
的 对 手 )， 但 在 纯 几 率 游戏 中 ， 统 计 学 家 们 学 会 了 接受 能 够 预料 到 的 情况 。 


se 4.2 ”知道 何 时 持 牌 
站 j 科 在 得 州 捍 克 中 “四 规则 ”使 用 简单 的 计数 来 估计 你 赢得 所 有 筹码 的 几 主 。 


无 限 下 注 得 州 扑克 无 处 不 在 。 写 这 篇 文章 时 ， 我 把 我 的 卫星 天 线 指 向 ESPN 、ESPN2 、 经 典 
ESPN 、 福 克 斯 体育 、 精 彩电 视 台 ( Bravo ) 或 是 E 频 道 ， 我 能 看 到 职业 扑克 玩家 、 幸 运 的 业余 爱好 
者 、 大 名 人 、 小 名 人 甚至 ( 主 啊 帮 帮 有 我 们 吧 ， 在 高 速 频道 ) NASCAR 车 手 都 在 玩 这 个 简单 的 游戏 。 

你 可 能 自己 玩 这 个 游戏 , 或 至 少 观 看 这 个 游戏 。 这 个 游戏 最 流行 的 版 本 很 简单 。 所 有 玩家 以 
相同 的 筹码 开始 。 当 他 们 的 筹码 都 没有 了 时 ， 他 们 也 就 离开 了 。 每 一 轮 中 ， 玩 家 得 到 两 张 牌 ， 这 
两 张 牌 只 有 他 们 自己 (和 有 专利 的 牌 桌 上 的 小 相机 ) 看 得 到 。 然 后 , 将 3 张 公共 有 牌 的 牌 面 翻 转 朝 上 ， 
这 叫做 翻 牌 。 随 后 将 另 一 张 公共 牌 ， 牌 面 翻转 朝 上 ， 这 就 是 转 牌 。 最 后 ， 再 一 张 公 共 牌 ， 河 牌 ， 
将 其 牌 面 翻转 朝 上 。 每 个 阶段 都 有 投注 。 玩 家 使 用 这 7 张 牌 中 的 任意 5 张 (5 张 公共 牌 , 加 上 他 们 手 
里 的 两 张 牌 ) 来 组 成 他 们 能 组 成 的 最 好 的 5 张 牌 。 所 有 5 张 牌 的 组 合 中 ， 最 大 的 组 合 赢得 比赛 。 
因为 有 些 牌 正面 朝 上 ,所 以 玩家 能 获得 一 些 信息 。 他 们 也 知道 自己 手 里 的 牌 是 什么 , 这样 他 
们 掌握 的 信息 就 更 多 了 。 他 们 还 知道 一 副 标 准 的 52 张 扑克 牌 中 所 有 牌 的 分 布 。 所 有 这 些 已 知 的 关 
于 值 分 布 的 信息 [Hack #1]， 使 州 扑克 有 很 好 的 机 会 处 处 使 用 统计 Hack[Hack #36 和 Hack #38]。 

一 个 特别 关键 的 决策 点 是 : 翻 牌 后 那 轮 的 下 注 。 还 有 两 张 牌 ， 可 不 可 能 提高 你 的 手 牌 。 如 果 
你 还 没有 最 佳 手 牌 (nuts ), 知道 下 两 张 牌 有 多 大 几率 能 提高 你 的 手 牌 也 是 不 错 的 。 四 法 则 使 得 你 
能 够 轻松 上 且 相 当 准 确 地 估算 这 些 几 率 。 











法 
































4.2.1 工作 原理 

四 法 则 工作 原理 如 下 : 数 出 ( 数 的 时 候 不 要 动 你 的 嘴唇 ) 一 副 牌 里 能 够 帮 你 提高 手 牌 的 牌 的 
数量 ， 把 这 个 数字 乘 以 4。 所 得 乘积 就 是 你 得 到 一 张 或 多 张 这 种 牌 的 几率 。 

1. 示例 1 


你 有 一 张 方 片 J 和 方 片 3。 翻 牌 是 梅花 K、 方 片 6 和 方 片 10。 你 有 4 张 牌 冲击 同 花 ， 有 9 张 牌 能 
你 获得 同 伦 。 当 然 ， 其 他 牌 也 可 以 帮 你 〈 比如 一 张 ] 会 帮 你 组 成 一 对 J)， 但 不 是 以 让 你 觉得 会 赢 
的 方式 o 
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因此 ， 有 9% 张 牌 会 真正 帮 到 你 。 四 法 则 估计 你 有 36% 的 几率 (9 x 4=36 ) 在 转 牌 或 河 牌 时 达到 
同 花 。 所 以 ， 你 有 大 约 1/3 的 几率 。 如 果 能 在 不 投入 太 多 筹码 的 情况 下 继续 玩 下 去 ， 那 你 也 许 应 
该 通过 跟 注 继续 玩 下 去 。 





2. 示例 2 
你 有 一 张 方 片 A 和 一 张 梅 花 2。 翻 牌 拿 到 了 红心 K、 黑 桃 4 和 方 片 7。 你 可 以 算出 ， 有 6 张 牌 能 





真正 帮 到 你 : 3 张 A 或 3 张 2 的 任何 一 张 。 如 果 你 赌 到 最 后 ， 一 对 2 很 可 能 只 意味 着 麻烦 ， 所 以 假设 
你 希望 看 到 的 牌 有 3 张 ， 都 是 A。 你 只 有 12% 的 机 会 (3 x 4=12 )。 弃 牌 吧 。 

















4.2.2 ”生效 原理 


这 里 涉及 的 数学 计算 将 一 些 重要 的 值 进行 了 四 舍 五 入 ,使 得 法 则 简化 。 思 路 如 下 : 一 副 牌 中 
大 约 还 留 有 50 张 牌 。( 更 准确 地 说 ,还 有 47 张 牌 你 没有 见 过 )。 当 叫 任 意 一 张 牌 时 ， 叫 到 你 想 要 的 
牌 的 几率 [Hack #3] 是 这 个 数 除 以 50。 




















我 知道 ， 实 际 上 是 1/47。 但 我 已 经 告诉 了 你 ,为 了 使 得 “四 法 则 ”容易 记忆 ,一 些 东 
西 已 经 被 简化 。 





不 管 概率 是 多 少 ， 我 们 继续 计算 ， 因 为 你 叫 了 两 次 牌 ， 所 以 概率 应 该 加 倍 。 





nw 这 也 不 完全 正确 ， 因 为 在 叫 河 牌 时 ， 牌 池 略 小 ， 所 以 你 的 几率 会 咯 高 一 点 。 





对 于 第 一 个 例子 ， 四 法 则 估计 同 花 的 几率 是 36%。 实 际 几率 是 35%。 事 实 上 ， 使 用 四 法 则 的 
估计 的 和 实际 的 几率 往往 相差 正 负 几 个 百分点 。 





4.2.3 ”其 他 适用 领域 


注意 ， 此 方法 也 适用 于 只 剩 一 张 牌 的 情况 ,但 在 这 种 情况 下 ,法则 被 称 作 二 法 则 。 将 你 想 要 
的 牌 加 和 ， 然 后 乘 以 2， 就 能 相当 准确 地 估计 只 剩 河 牌 时 你 获胜 的 几率 。 在 大 多 数 情 况 下 ， 这 个 
估计 大 约会 偏离 两 个 百分点 ， 所 以 聪明 的 统计 学 扑克 玩家 称 之 为 2+2 法 则 。 





4.2.4 ”不 适用 领域 

随 着 能 帮助 你 的 牌 的 数量 增加 ， 四 法 则 结果 的 偏离 程度 也 会 变 大 。 当 有 12 张 出 路 牌 ( 能 帮 你 
的 牌 ) 时 ， 它 是 相当 准确 的 ， 叫 到 这 些 有 帮助 的 牌 的 实际 几率 是 45%， 四 法 则 估计 的 是 48%。 但 
当 有 超过 12 张 的 牌 可 以 帮助 你 时 ， 四 法 则 的 估算 结果 会 比 实际 高 出 不 少 。 
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为 了 不 通过 计算 证 实 这 一 点 , 假设 有 25 张 牌 (从 47 张 牌 中 抽取 ) 可 以 帮 到 你 。 这 是 一 个 绝 佳 场 
景 (我 至 今 无 法 想到 会 产生 如 此 多 的 出 路 牌 的 场景 ), 但 四 法 则 说 你 有 100% 的 机 会 能 拿 到 帮助 牌 中 
的 一 张 。 你 知道 这 是 不 对 的 。 毕 竞 ， 你 叫 的 牌 中 有 22 张 牌 ， 完 全 不 能 帮 到 你 。 真 正 的 几率 是 79%。 
当然 ， 在 这 种 情况 下 失 算 ， 不 太 可 能 伤害 到 你 。 在 任何 一 种 估计 下 ， 你 都 会 一 直 赢 到 弃 牌 。 


























1 耳 4.3 ”知道 何 时 弃 牌 
到 时 应 得 州 盾 克 中 ， 底 池 赔 率 的 枝 念 提供 了 一 个 功能 强大 、 类 定 何 时 跟 牌 何 时 弃 牌 的 工具 。 











如 果 你 在 电视 上 观看 扑克 比赛 ,你 会 迅速 学 到 一 大 堆 行 话 。 你 会 听 到 带 A- 区 的 成 手 (big slick )、 
一 对 A (bullets )、 全 押 (all-in ) 以 及 输 钱 后 不 好 的 行为 (tilt ) 等 。 你 还 将 听 到 关于 底 池 赔 率 的 讨 
论 ， 如 :“ 他 或 许 会 在 这 跟 牌 ， 不 是 因为 他 认为 他 有 最 好 的 牌 ， 而 是 因为 底 池 赔 率 。? 

当 底 池 赔 率 合适 时 ， 即 使 概率 显示 你 会 输 ， 你 也 应 该 跟 一 手 牌 。 那 么 , 什么 是 底 池 赔 率 ， 为 
什么 在 我 可 能 输 的 情况 下 ， 还 要 把 更 多 的 钱 放 到 池子 里 ? 


























4.3.1 ” 底 池 赔 率 

底 池 赔 率 是 通过 比较 你 赢得 底 池 的 几率 和 赢得 底 池 能 获得 的 筹码 量 计 算出 来 的 。 例 如 , 如果 
你 估计 你 将 有 50% 的 机 会 赢得 底 池 , 但 底 池 太 大 , 以 至 于 赢得 它 能 获得 比 跟 牌 成 本 两 倍 还 多 的 钱 ， 
那么 你 应 该 跟 牌 。 

看 看 到 底 池 赔 率 是 如 何在 实践 中 生效 的 ， 这 里 是 一 个 有 4 名 玩家 的 场景 : 西 尔 玛 、 路 易 丝 、 
迈克 和 文 斯 。 如 表 4-3 所 示 ， 西 尔 玛 在 翻 牌 前 处 于 最 佳 状态 。 

















氧 下 面 的 表格 显示 了 在 一 轮 中 的 每 个 节点 ， 每 个 玩 
至 右 , 然后 从 上 到 下 查看 此 表 ， 看 看 西 尔 玛 是 怎 
么 想 怎 么 做 的 ， 等 等 。 


家 基于 底 池 赔 率 作出 的 决策 。 从 左 
么 想 的 怎么 做 的 ， 还 有 路 易 丝 是 怎 


表 4-3: 玩家 起 手 牌 








玩家 西 尔 玛 路 易 丝 迈克 文 斯 
起 手 牌 梅花 A、 红 心 2 梅花 2 、 梅 花 4 红心 4、 黑 桃 5 方 片 K、 方 片 10 
开始 的 赌注 50 50 50 50 





然后 翻 牌 : 黑 桃 A、 方 片 3 和 方 片 6。 表 4-4 是 对 每 个 玩家 的 处 境 分 析 。 在 翻 牌 后 ， 他 们 中 的 3 








人 都 希望 能 改善 他 们 的 手 牌 ， 而 他 们 中 的 一 个 一 一 西 尔 玛 ， 考 虑 到 自己 现在 有 最 好 的 手 牌 ,可 能 
会 满足 现状 ， 不 打算 改善 手 牌 。 西 尔 玛 正 驱 动 着 下 注 ， 其 他 3 名 玩家 决定 是 否 跟 牌 。 
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表 4-4: 翻 牌 后 的 分 析 












































玩家 西 尔 玛 路 易 丝 迈克 文 斯 

需要 的 牌 4 个 5 里 的 任意 一 个 ”4 个 2 或 4 个 7 里 的 任意 一 个 9 张 方 片 里 的 任意 一 张 
获得 牌 的 几率 16% 32% 36% 

目前 的 底 池 200 250 250 300 

跟 牌 所 花 金钱 占 底 池 的 20% 20% 17% 

百分比 

行动 下 注 50 弃 牌 跟 50 跟 50 





表 4-4 给 出 了 翻 牌 后 底 池 赔 率 的 用 法 。 西 尔 玛 开始 的 时 候 有 一 对 A, 并 在 翻 牌 时 获得 第 三 个 A。 


因此 , 她 以 下 注 开 启 每 一 轮 。 其 他 尚未 获得 任何 好 牌 的 玩家 必须 决定 是 否 留 下 来 ,他 们 和 希望 改善 


他 们 的 手 牌 ， 让 手 牌 变 强 ， 变 成 可 能 的 局 家 。 











玩家 需要 作出 跟 牌 或 弃 牌 的 决定 时 , 底 池 赔 率 开 始 发 挥 作 用 。 路 易 丝 需要 一 个 $ 来 凑 成 顺 子 ， 
她 估计 在 下 两 张 牌 中 有 16% 的 几率 能 拿 到 一 个 3。 然而， 目前 底 池 为 230 美 元 。 其 中 西 尔 玛 跟 注 了 
50 美 元 ， 如 果 选 择 跟 牌 ， 路 易 丝 将 不 得 不 支付 底 池 的 20%。 这 是 20% 的 成 本 和 16% 赢 取 底 池 的 几 





率 对 比 。 风 险 大 于 收益 ， 因 此 路 易 丝 弃 牌 。 但 是 ， 
建议 他 们 继续 玩 下 去 。 

接 下 来 是 转 牌 : 梅花 J。 如 表 4-5 所 示 ， 转 牌 后 
抽 到 一 张 赢 牌 更 好 ， 他 弃 牌 。 虽 然 和 迈克 相 比 ， 文 
他 应 该 弃 牌 时 ， 他 也 最 终 弃 牌 。 

















表 4-5: 转 牌 后 分 析 














迈克 和 文 斯 ， 有 更 多 的 出 路 牌 ， 所 以 底 池 赔 率 





， 只 剩 一 张 牌 没 发 ， 迈 元 的 底 池 赔 率 不 再 比 他 











斯 开始 时 有 湾 在 更 好 的 手 牌 ， 当 底 池 赔 率 表明 








玩家 西 尔 玛 路 易 丝 迈克 文 斯 

需要 的 牌 和 之 前 一 样 和 之 前 一 样 
获得 牌 的 几率 18% 20% 

目前 底 池 350 450 450 

跟 牌 花费 占 底 池 的 比例 22% 22% 

动作 跟 注 100 弃 牌 弃 牌 














我 们 假设 玩家 只 使 用 底 池 赔 率 来 做 决策 , 不 考虑 他 们 很 可 能 试图 读 懂 其 他 玩家 的 影响 ( 例如 
虚 张 声势 、 加 注 ， 等 等 )。 顺便 说 一 名 ,玩家 使 用 四 法 则 和 2 加 2 法 则 [Hack #56] 计 算 他 们 获得 一 张 


能 改善 他 们 手 牌 的 牌 的 几率 。 


4.3.2 ”生效 原理 














想象 一 下 ， 有 个 游戏 需要 花 1 美 元 来 玩 。 假 设 规则 是 这 样 的 : 一 半 的 时 间 你 会 赢 ， 并 因此 获 
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得 3 美元 ; 男 一 半 时 间 ， 你 会 输 掉 1 美元 并 获得 2 美元 。 随 着 时 间 推 移 ， 如 果 你 一 直 玩 这 个 疯狂 的 
游戏 ， 你 会 获得 一 大 笔 钱 。 

在 扑克 中 使 用 底 池 赔 率 ， 和 这 是 相同 的 思想 。 有 36% 的 几率 促成 同 花 ， 完 全 公平 的 下 注 是 下 
底 池 36% 的 注 。 从 长 远 来 看 ， 你 会 有 36% 的 时 间 获 得 同 花 ， 达 到 收 支 平衡 。 如 果 你 的 支付 少 于 底 
池 的 36%， 长 期 来 看 仍然 有 36% 的 获胜 几率 ,车 你 能 在 这 样 的 游戏 里 玩 牌 ， 那 你 应 该 玩 这 个 疯狂 
的 游戏 ， 对 不 对 ? 好 了 ， 每 一 次 你 发 现 自己 的 处 境 是 底 池 赔 率 比 你 必须 下 注 的 比例 要 高 的 时 候 ， 
你 就 可 以 玩 这 样 疯狂 的 游戏 。 相 信 统 计 学 。 玩 这 个 疯狂 的 游戏 。 

















4.3.3 ”其 他 适用 领域 


有 经 验 的 玩家 不 仅 使 用 底 池 赔 率 对 弃 牌 做 决策 , 他 们 甚至 用 一 个 稍微 更 复杂 的 概念 , 叫做 隐 
含 的 底 池 赔 率 (implied pot odds )。 隐 含 的 底 池 赔 率 不 基于 一 个 玩家 必须 跟 注 的 数量 占 目 前 底 池 
的 比例 ， 而 是 基于 当 那 轮 下 注 完成 时 ， 跟 注 占 底 池 总 数 的 比例 。 

如 果 玩 家 们 仍然 没有 采取 行动 , 一 名 犹 驳 不 决 是 否 基 于 底 池 赔 率 而 留 下 的 玩家 可 能 期 望 其 他 
玩家 彻底 跟 进 。 这 增加 了 最 终 底 池 的 量 , 增加 了 如 果 他 获得 自己 期 望 的 牌 所 赢 取 的 金额 ,并 在 所 
有 下 注 完成 后 ， 增 加 了 实际 的 底 池 赔 率 。 

短语 “ 隐 含 的 底 池 赔 率 ” 有 时 也 用 来 指 : 和 所 有 下 注 轮 数 完成 后 最 终 总 的 底 池 相 比 ， 相 对 下 
注 的 花费 。 我 也 听 说 过 这 个 词 用 来 形容 如 果 你 碰巧 “获得 最 佳 手 牌 ”( 得 到 一 个 不 太 可 能 获得 的 
强 有 力 的 手 牌 )， 或 接近 它 的 手 牌 ， 那 么 你 很 可 能 赢 的 比 一 般 底 池 要 多 。 有 些 玩家 花费 了 大 量 的 
精力 ， 进 行 了 很 多 跟 注 ， 只 是 希望 获得 这 些 超 级 手 牌 中 的 一 张 ， 从 而 大 捞 一 笔 。 

隐 含 的 底 池 赔 率 是 这 样 生效 的 。 在 表 4-3 这 个 场景 中 ,迈克 可 能 在 转 底 后 已 经 跟 注 了 (第 四 
张 发 的 牌 )， 他 预计 文 斯 也 会 跟 。 这 将 使 最 终 的 底 池 增 加 到 650， 使 得 迈克 那 轮 的 成 本 只 有 15%， 
并 证 明 他 跟 注 的 正确 性 。 

有 趣 的 是 ， 如 果 文 斯 投注 时 的 底 池 已 经 含有 迈克 的 跟 注 而 变 得 稍 大 一 点 ， 那 么 文 斯 的 100 个 
筹码 跟 注 的 底 池 赔 率 将 下 降 到 18% , 文 斯 可 能 会 跟 注 。 事实 上 , 如 果 迈 克 是 一 个 超级 天 才 型 玩家 ， 
他 有 可 能 在 转 牌 时 跟 牌 ， 他 知道 那样 会 改变 文 斯 的 底 池 赔 率 , 因此 这 也 鼓励 了 他 跟 注 。 现 实生 活 
中 的 职业 扑克 选手 一 一 真 的 ， 很 好 的 职业 扑克 选手 有 时 真是 那么 想 的 。 




































































4.3.4 不 适用 领域 


请 记 住 ， 底 池 赔 率 基 于 这 样 的 假设 : 你 玩 扑 克 的 时 间 无 限 长 。 不 过 ,如果 在 一 个 无 限制 的 锦 
标 赛 中 ,由 于 你 没有 无 限 的 资本 ,所 以 你 可 能 不 愿意 基于 从 长 远 来 看 会 发 生 什么 的 信念 ,而 冒失 
去 你 全 部 筹码 或 大 部 分 筹码 的 风险 。 
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底 池 赔 率 基于 的 另 一 个 生死 依 关 的 假设 是 ,你 把 “非常 好 的 牌 ” 视 作 能 保证 你 会 赢 的 牌 。 当 
然 ， 事 实 并 非 如 此 。 其 他 玩家 可 能 也 有 非常 好 的 牌 ， 有 比 你 更 好 的 牌 。 


| Peyy 44 知道 什么 时 候 离 开 
在 得 州 装 克 中 ， 当 你 “筹码 短缺 时， 你 只 有 两 个 选 择 ， 立刻 全 押 吕 过 一 会 儿 再 全 
押 。 正 如 你 可 能 已 经 猎 到 的 那样 ， 计 么 时 候 做 最 后 一 持 也 是 一 个 概 症 问题 。 


我 在 电视 里 听 得 州 扑克 锦标 赛 的 扑克 评论 员 谈论 当 羞 码 短缺 时 ,下 决定 是 如 何如 何 “ 容 易 ”。 
他 们 说 它 容易 ， 是 因为 没有 太 多 的 选择 。 


“筹码 短缺 ”这 个 术语 可 以 有 几 种 不 同 的 用 法 。 有 时 ,， 它 被 用 来 指 赌 桌 上 拥有 最 少 筹码 的 人 。 
在 这 种 用 法 下 ， 即 使 你 有 成 千 上 万 的 筹码 并 能 付 得 起 100 底 注 和 大 盲 注 ， 如 果 其 他 人 有 更 多 的 筹 
码 ， 你 也 算是 筹码 短缺 。 
一 个 更 好 的 、 更 适用 于 基于 统计 数据 做 决策 的 定义 是 : 当 你 只 能 再 付 得 起 几 次 底 注 和 育 注 时 ， 
你 就 是 筹码 短缺 。 根 据 这 一 定义 , 赌 上 所 有 、 希 望 能 启 得 两 倍 或 三 倍 而 回 到 游戏 中 的 压力 越 来 越 
大 。 我 更 喜欢 这 个 用 法 ， 因 为 没有 压力 的 话 ,“ 筹 码 短 缺 ”的 处 境 就 没有 太 大 意义 。 
但 是 当 你 筹码 短缺 ， 必 须 全 押 【( 赌 上 你 的 所 有 ) 时 ， 这 并 不 容易 ， 容 易 吗 ?” 这 非常 非常 难 ， 
原因 有 二 。 
口 你 可 能 不 会 赢得 比赛 。 你 意识 到 你 的 筹码 下 降 到 了 很 少 ， 不 得 不 对 下 注 进行 好 几 次 的 加 
倍 以 回 到 游戏 中 。 实 际 上 ， 你 怀疑 你 是 否 有 很 好 的 机 会 。 这 是 令 人 诅 丧 的 ， 在 你 悲伤 时 
做 任何 决定 都 是 困难 的 。 
口 你 犯 了 一 个 错误 ， 你 出 局 了 。 在 这 样 高 风险 情况 下 ， 你 没有 多 少 犯 错 的 余地 ， 所 以 很 难 
下 决定 。 
运用 一 些 基 本 的 统计 原则 帮助 决策 , 可 能 会 使 你 感觉 好 点 。 至 少 你 有 一 些 不 会 感情 用 事 的 准 
则 可 以 遵循 。 当 你 输 掉 时 ( 你 仍然 可 能 会 输 ， 毕 竞 你 处 于 筹码 短缺 状态 )， 你 可 以 怪我 ， 或 怪 命 
运 ,不 要 怪 上 自己。 






































4.4.1 ”辨识 筹码 短缺 的 情况 

在 比赛 中 ， 有 时 你 的 筹码 非常 少 ， 以 至 于 你 将 很 快 耗 尽 它们 。 除 非 你 下 注 并 很 快 获胜 ， 不然 
你 就 会 因 讶 注 而 用 光 筹 码 : 强制 下 注 的 代价 会 把 你 的 钱 榨 干 。 

究竟 什么 情况 算 筹 码 短缺 ”即使 我 们 把 筹码 短缺 定义 为 有 多 个 大 育 注 (在 一 轮 中 , 你 被 迫 必 
须 投 注 的 两 注 里 较 大 的 那 注 )， 你 需要 多 少 这 样 的 大 育 注 也 因 人 而 异 ， 并 没有 一 个 统一 的 正确 数 
字 。 这 里 有 一 些 关 于 你 面前 有 多 少 筹 码 就 可 以 认为 自己 筹码 短缺 的 不 同 观点 。 
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1. 12 倍 的 大 言 注 或 更 少 

虽然 你 可 以 在 不 消耗 完 筹码 的 情况 下 再 玩 一 段 时 间 ， 但 你 会 想 在 任意 尚 可 的 手 牌 上 赌 一 把 。 
你 希望 在 这 里 赢得 一 些 育 注 。 你 赢得 的 盲 注 越 多 ,你 可 用 于 等 待 杀手 级 手 牌 的 时 间 就 越 长。 如果 
别人 对 你 加 注 了 ， 你 至 少 考虑 以 一 个 全 押 回 应 。 

认为 自己 开始 筹码 短缺 的 玩家 , 希望 在 现在 有 好 手 牌 的 情况 下 全 押 ， 而 不 是 在 之 后 有 普通 手 
有 牌 情况 下 被 迫 全 押 。 开 始 冒 险 的 男 外 一 个 优点 是 : 公布 “全 押 ” 后 仍然 会 起 一 些 作用 。 你 将 有 足 
够 的 筹码 让 别人 三 思 而 后 跟 注 。 随 后 ， 你 那 可 怜 的 小 筹码 将 不 足以 摆布 任何 人 。 


当 你 采取 全 押 希 望 导致 对 手 弃 牌 时 ,要 尽 可 能 明智 地 选择 你 的 对 手 。 采取 同样 的 全 
押 策 略 ， 对 手 是 小 筹码 时 你 的 全 押 会 比 对 手 是 巨大 筹码 时 更 有 威力 。 同 样 的 道理 ， 
如 果 你 想 跟 注 ， 面 对 拥有 大 量 筹 码 的 对 手 时 ， 不 要 犹 移 进行 全 押 。 他 们 会 很 乐意 将 
你 的 赌注 翻 倍 。 



































2. 8 倍 大 盲 注 或 更 少 

无 论 你 在 任何 位 置 ， 庄 家 位 、 大 盲 注 ， 还 是 先 下 注 ， 在 拥有 任何 前 10 的 手 牌 时 ， 考 虑 宣布 全 
押 。 你 依然 有 足够 的 筹码 吓 退 一 些 玩 家 ， 尤 其 是 那些 拥有 差不多 等 量 筹码 的 人 。 

但 是 ,你 的 筹码 开始 变 得 很 少 , 少 到 你 真 的 想 被 跟 注 .如果 你 可 以 低 成 本 地 玩 一 些 低 对 牌 ( low 
pairs )， 试 试 吧 ， 但 如 果 你 没有 在 翻 牌 中 凑 成 三 条 (three ofa kind )， 此 时 需 摆脱 困境 。 你 需要 保 
持 尽 可 能 多 的 大 盲 注 ， 直 到 你 有 全 押 的 机 会 。 

下 面 是 10 手 最 有 可 能 让 你 翻 倍 和 赢得 筹码 的 牌 : 

口 一 对 A、K、Q.、 或 10; 
口 同一 花色 的 A~K、A~Q、A~] 或 K~Q; 
口 不 同 花 色 的 A~K。 

3. 4 倍 大 盲 注 或 更 少 

这 个 时 候 ， 即 使 手 牌 有 超过 50% 的 几率 会 输 ， 你 也 需要 全 押 上 。 故 意 下 一 注 糟糕 的 赌注 似乎 有 
悖 常理 , 但 你 正在 和 你 希望 翻 倍 却 不 断 蔚 缩 的 基础 筹码 数 做 斗争 。 如 果 你 等 啊 等 ,直到 好 的 时 机 
出 现 才 全 押 ， 那 么 不 管 筹码 还 剩 多 少 ， 你 将 不 得 不 花 好 几 倍 额外 的 时 间 让 自己 回 本 。 

底 池 赔 率 [Hack #7] 在 这 时 候 开 始 生 效 。 如 果 为 了 等 待 一 个 50% 启 的 几率 而 放弃 25% 启 的 几 
率 ， 那 么 你 赢得 的 金额 只 有 ( 如 果 ) 你 有 机 会 获得 更 好 手 牌 时 的 一 半 。 出 现任 何 一 对 、 一 张 A 和 
别 的 什么 牌 、 任 何人 头 牌 : 和 良好 的 起 脚 牌 *， 或 同 花 连 牌 时 ， 毫 无 疑问 要 全 押 。 



























































注 1: 纸牌 中 的 K、Q 和 J。 一 一 译 者 注 
注 2: 在 得 州 扑克 里 ，2 张 起 手 牌 中 小 的 那 张 就 叫做 起 脚 牌 。 一 一 译 者 注 
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当 你 的 筹码 非常 非常 少时 ( 即 ,你 的 总 筹码 少 于 4 倍 大 盲 注 ), 一 个 好 的 经 验 法 则 是 : 

轴 只 要 你 拿 到 加 起 来 是 18 或 更 好 的 牌 ， 就 全 押 。 开 算 作 13、Q 算 作 12、J 算 作 11， 其 余 
的 牌 是 其 面值 。 A 算 作 14, 但 你 已 经 在 A 与 任意 牌 的 组 合 下 全 押 了 ， 所 以 A 算 作 什么 
无 所 谓 。18 点 的 手 牌 包括 10~8、J~7、Q~6 和 K~5。 


4.4.2 ”统计 决策 

当 你 宣布 全 押 或 者 至 少 决定 被 套牢 ( 如 果 被 动情 况 下 , 有 这 么 多 筹码 在 底 池 ， 以 至 于 你 想 全 
押 ) 时 ， 统 计 可 以 告诉 你 : 在 你 输 光 所 有 筹码 前 ， 是 不 是 有 可 能 获得 更 好 的 手 牌 ? ” 

我 打算 组 50 张 看 起 来 还 不 错 、 值 得 玩 的 得 州 扑克 起 手 牌 , 这 些 牌 能 让 你 有 机 会 赢 取 少 数 对 手 。 
我 将 使 用 3 组 ， 如 表 4-6 至 表 4-8 所 示 。 虽 然 不 同 的 扑克 专家 可 能 会 对 给 定 手 牌 的 优良 程度 有 争议 ， 
但 筹码 短缺 时 ， 大 多 数 人 都 认为 这 些 手 牌 至 少 可 玩 。 


贞 顺便 说 一 句 ， 每 组 中 手 牌 不 是 按照 质量 排序 的 。 




















表 4-6 : 10 个 很 棒 的 起 手 牌 
= 同一 花色 不 同 花 色 
对 A、 对 K、 对 Q、 对 J、 对 10 A~K、A~Q、A~J、K~Q A~K 





表 4-7: 15 个 不 错 的 起 手 牌 








一 于 同一 花色 不 同 花 色 
对 9、 对 8、 对 7 A~10、 K~J. K~10、 Q~J. Q~10、 I~10. J~9. 10~-9、 A-Q、A-J、KQ 
9~8 


表 4-8: 25 个 还 可 以 的 起 手 牌 
= 一 ”对 同一 花色 不 同 花 色 
对 6、 对 5 A~9、 A~8、A~7、A~6、A~5、A~4、 A~3、A~2、 A~10、 K~J. Q~J. K~10、 Q~10、 
K-9、Q-9、10-8、9-7、8-7、8-6、7-6、6-5、5-4 I~10 





当 你 筹码 短缺 时 ， 盲 注 和 强制 性 的 底 注 都 将 来 临 ， 在 你 行动 前 ， 你 知道 自己 有 一 定数 目的 剩 
余 手 牌 。 表 4-9 显 示 了 你 在 下 几 次 发 牌 中 ， 得 到 很 棒 的 、 不 错 的 或 还 可 以 的 牌 的 可 能 | 





表 4-9: 获得 可 玩 手 牌 的 几率 





手 牌 质量 下 张 手 牌 5 次 发 牌 10 次 发 牌 15 次 发 牌 20 次 发 牌 
很 棒 4% 20% 36% 49% 59% 


不 错 7% 29% 50% 65% 75% 
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( 续 ) 
手 牌 质量 下 张 手 牌 5 次 发 牌 10 次 发 牌 15 次 发 牌 20 次 发 牌 
还 可 以 11% 46% 70% 84% 91% 
还 可 以 或 更 好 22% 72% 92% 98% 99% 


”我 是 这 么 计算 表 4-9 的 概率 的 : 首先 计算 任何 特定 一 对 ( 你 很 可 能 同样 得 到 一 对 A 和 
0 se a 
( 0.003 ), 再 然后 计算 任意 两 张 特定 的 不 同 花 色 且 不 同 点 数 的 概率 (0.009 )。 下 一 步 ， 
对 于 每 个 类 (很 棒 、 不 错 或 还 可 以 的 手 牌 )， 将 那 一 类 中 的 对 数 、 不 成 对 的 同 花 手 
牌 数 以 及 不 成 对 也 不 同 花 的 手 牌 数 分 别 乘 以 相应 的 概率 ， 依 此 类 推 。 最 后 ， 计 算 在 
给 定 机 会 数 中 没有 获得 期 望 手 牌 的 概率 ， 用 1 减 去 那个 值 ， 就 得 出 表 中 每 个 单元 格 

的 值 。 





下 面 讲解 如 何 使 用 表 4-9。 假 设 你 筹码 短缺 时 ， 刚 刚 发 得 了 一 手 好 牌 。 如 果 你 认为 在 随后 5 手 
中 的 某 个 时 刻 你 必须 全 押 , 只 有 20% 的 几率 你 会 发 到 更 好 的 牌 。 所 以 , 你 应 该 在 这 手 好 牌 上 全 押 。 

如 果 你 能 再 坚持 20 轮 发 牌 ， 那 么 有 大 于 50% 的 几率 ， 你 会 得 到 能 使 你 获得 巨大 成 功 的 手 牌 ， 
所 以 如 果 你 想 保险 些 ， 你 现在 可 以 不 必 全 押 。 更 常见 的 是 ， 筹 码 短 缺 玩 家 甚至 在 没有 排名 前 50 
位 的 手 牌 的 情况 下 ,考虑 全 押 , 例如 不 同 花 色 的 K~8 这 种 。 使 用 表 4-9 的 概率 ,你 可 以 放心 地 放下 
手 牌 ， 并 和 希望 在 随后 的 $ 手 中 有 更 好 的 手 牌 。 有 72% 的 几率 ， 你 会 得 到 这 样 的 手 牌 。 


最 后 ,想象 一 下 ， 你 手 里 只 剩 下 一 些 牌 ， 因 为 育 注 正 让 你 的 筹码 趋 于 零 。 你 往 下 看 ， 看 到 一 
个 像样 的 、 还 可 以 的 手 牌 ， 如 同一 花色 的 8~7。 表 4-9 能 够 使 你 回答 一 个 重大 问题 : 你 的 下 一 手 可 
能 会 比 这 一 手 更 好 吗 ? 你 有 11% 的 几率 在 下 一 手 获得 一 个 不 错 的 或 更 好 的 手 牌 。 所 以 ， 你 的 手 牌 
不 太 可 能 得 到 改善 。 在 这 手 牌 上 赌 上 你 的 未 来 。 



































4.4.3 ” 理 清 思路 


前 面 我 们 谈 到 ,在 筹码 短缺 时 , 为 什么 玩 牌 让 人 感觉 如 此 困难 。 这 里 有 一 些 帮 你 与 进退 两 难 
做 斗争 的 心理 技巧 。 

@ 现实 一 点 

在 21 点 牌 中 ， 闲 家 (player ) 抽 到 16， 庄 家 ( dealer ) 抽 到 7， 闲 家 知道 自己 很 可 能 会 破 21 点 。 
无 论 如 何 ， 他 还 是 抽 牌 了 ， 因 为 庄家 可 能 有 10 点 以 下 的 牌 ， 这 给 几乎 不 能 赢 的 他 最 后 一 线 生机 。 
他 知道 他 已 经 尽力 给 自己 最 好 的 幸存 机 会 ， 这 令 他 很 高 兴 。 同 样 的 思路 也 适用 于 这 里 : 你 知道 给 
了 自己 回 到 赌 桌 并 赌 启 的 最 好 机 会 ， 这 令 你 很 高 兴 。 
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@ 享受 全 押 体 验 
没有 什么 比 全 押 上 更 激动 人 心 。 因 为 对 于 全 押 你 没有 选择 的 余地 ， 所 以 放松 下 来 尽 自己 所 能 
享受 它 吧 。 没 有 玩家 会 责备 你 做 “这 么 思春 的 事情 ”， 因 为 你 只 是 做 了 自己 能 做 的 最 明智 的 事 。 
@ 采取 控制 
为 了 避免 使 自己 感觉 被 迫 做 了 不 想 做 的 事 , 在 不 得 不 做 之 前 就 开始 你 卷土重来 的 计划 。 当 你 
依然 有 10~12 倍 大 盲 注 的 筹码 时 ， 就 要 采取 行动 避免 筹码 短缺 。 这 个 时 候 的 你 比 之 后 有 更 多 的 机 
会 ,所 以 你 能 够 基于 自身 位 置 、 对 手 以 及 马 脚 等 ， 更 精妙 地 发 挥 。 你 的 筹码 越 少 ， 你 掌握 自己 命 
运 的 力量 就 越 小 。 























Le Ek 4.5 在 轮 盘 赌 中 输 慢 点 
轮 盘 赌 有 很 多 漂亮 颜色 以 及 连 小 猫 都 喜欢 的 光 治 。 此 外 ， 你 玩 轮 盘 赌 的 时 候 看 起 来 
很 酷 。 但 是 从 长 远 来 看 ， 你 会 输 钱 ， 拓 和 恶 所 有 与 之 相关 的 事物 。 


像 赌场 中 的 大 多 数 游戏 一 样 , 轮 盘 赌 是 一 种 纯 几 率 的 游戏 。 没有 人 能 够 预测 小 球 最 终 会 落 在 
37( 欧洲 式 ) 或 38 (美国 式 ) 区 段 的 哪个 区 段 。 最 好 的 玩家 可 以 做 的 是 知道 概率 、 管 理 资金 ， 以 
及 假设 自己 会 输 掉 。 

当然 ,他 可 能 是 坟 运 的 ,可 能 会 说 得 一 些 钱 ,这 最 好 不 过 了 ,但 仍然 会 遵循 大 数 法 则 [Hack #2]。 
从 长 远 来 看 , 如 果 他 从 未 玩 过 这 个 游戏 , 他 现在 的 钱 很 可 能 要 多 一 些 。 事实 上 , 如 果 他 玩 无 限 次 ， 
他 一 定 会 赔钱 。( 当然 ， 大 部 分 轮 盘 赌 玩 家 没有 玩 无 限 次 ) 要 延长 玩 的 时 间 ， 你 应 该 知道 和 这 个 
游戏 相关 的 重要 统计 信息 : 转盘 、 轨 道 球 、 黑 色 和 红色 的 布局 。 























4.5.1 基本 赌注 


图 4-1 显 示 了 一 个 典型 的 轮 盘 游戏 的 投注 布局 。 这 是 一 个 美式 布局 ， 这 意味 着 有 两 个 绿色 的 
数字 ，0 和 00,〈 当 小 球 落 入 这 两 个 区 段 时 , ) 不 论 你 在 红色 和 黑色 或 奇数 和 偶数 上 下 注 ， 赌 场 都 
不 支付 给 你 钱 。 欧 式 风格 的 轮 盘 只 有 一 个 绿色 的 数字 0， 相 比美 国 赌场 , 减少 了 一 半 的 赌场 优势 。 


玩家 可 以 以 各 种 方式 投注 , 这 是 轮 盘 在 赌场 如 此 受 欢迎 的 原因 一 个 。 例 如, 玩家 可 以 把 一 个 
筹码 放 在 单个 数字 、 两 个 数字 、 一 种 颜色 甚至 相 邻 的 12 个 数字 上 ， 等 等 。 和 其 他 概率 问题 一 样 ， 
随机 获得 期 望 结 果 的 几率 是 预期 结果 ( 赢 ) 的 数目 除 以 结果 总 数 。 

转盘 上 有 38 个 间隔 ， 由 于 所 有 38 个 可 能 结果 的 概率 等 同 ， 所 以 计算 是 相当 简单 的 。 表 4-10 


显示 了 玩家 可 下 注 的 类 型 ， 赢 得 单 次 转盘 和 1 美元 赌注 时 赌场 支付 的 实际 金额 、 赌 场 优 势 等 必 
要 信息 。 
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图 4-1: 典型 轮 盘 投注 布局 
表 4-10: 轮 盘 赌 每 1 美元 的 统计 数据 











下 注 类 型 获胜 结果 数 。 失败 结果 数 ” 赔 率 赌场 支付 赌场 优势 公式 赌场 优势 
单个 数字 1 37 37:1 35 美 元 (37-35) / (38/1) 5.26% 
两 个 数字 2 36 36 : 2 或 18 : 1 17 美 元 (18-17) / (38/2) 5.26% 
单 色 18 20 20 : 18 或 1.11 : 1 ”1 美元 (1.11-1)/(38/18) 5.26% 
奇数 或 偶数 18 20 20 : 18 或 1.11 : 1 ”1 美元 (1.11-1)/(38/18) 5.26% 
12 个 数字 12 26 26 : 12 或 2.17 : 1 ”2 美元 (2.17-2)/(38/12) 5.26% 

















赌场 优势 是 这 么 计算 的 :首先 确定 如 有 果 没 有 赌场 优势 ， 赌 场 给 每 1 美元 的 赌注 回报 是 多 少 。 





公平 的 回报 是 : 




































































给 赢家 的 金额 等 于 所 冒 风险 的 量 。 所 冒 风险 的 量 ， 实 质 上 是 可 能 输 掉 的 结 


然后 , 用 没有 赌场 优势 情况 下 应 该 支付 给 赢家 的 金额 减 去 实际 支付 给 赢家 的 金额 。 最 后 , 将 这 些 


赌场 持 有 的 “额外 ”美元 除 以 结果 总 数 与 获胜 结果 数 的 比值 。 女 
玩家 间 均 匀 地 匹配 ， 赌 场 优势 是 0%。 

你 研究 表 4-10 中 的 轮 盘 统 计量 ， 一 系列 结论 是 显而易见 的 。 首 先 ， 赌 场 通过 假装 轮 盘 赌 
kh 钱 ， 然 后 使 用 那个 假装 分 布 给 赢家 支付 钱 。 





如 果 


上 只 有 36 个 数字 ( 即 只 有 36 个 可 能 的 结果 ) 来 赠 
第 二 ,不 考虑 轮 盘 赌 的 下 注 


认 , 但 是 , 在 轮 盘 赌 休 上 这 是 最 糟 的 赌 法 ，|] 





























类 型 ， 





























1 果 没 有 额外 的 美元 ,游戏 赌注 在 


赌场 优势 是 常数 5.26%。 除 了 不 知情 的 赌 徒 外 ， 这 是 大 家 公 
认 的 ， 也 是 大 多 数 赌场 允许 的 。 玩 家 往往 允许 在 两 个 和 它们 相 邻 的 数字 1、2 和 3， 一 共 5 个 数字 上 
下 注 。 这 是 通过 放 一 个 筹码 在 0 和 1 的 交界 线 上 完成 的 。 你 下 这 种 赌注 时 , 轮 盘 赌 的 营盘 人 会 检测 确 








是 在 6 个 数字 上 支付 。 因 此 ， 赌 场 一 贯 的 $.26% 的 优势 在 这 里 变 成 了 7.89%， 如 表 4-11 所 示 。 


是 没 有 统计 学 家 会 这 么 建议 。 人 允许 这 样 下 注 的 赌场 好 像 
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表 4-11: 轮 盘 赌 上 5 个 数字 的 下 注 统计 量 (一 个 不 明智 的 赌注 ) 


下 注 类 型 获胜 结果 数 。” ”失败 结果 数 ” 赔 率 赌场 支付 赌场 优势 公式 赌场 优势 
5 个 数字 5 33 33 : 5 或 6.6 : 1 ”6 美元 (6.6-6) / (38/5) 7.89% 





4.5.2 ”生效 原理 


轮 盘 的 流行 ,部 分 基于 这 样 一 个 事实 : 有 如 此 多 不 同类 型 的 赌注 。 一 个 有 很 多 筹码 的 赌 徒 5 
以 将 这 些 筹码 在 赌 桌 上 散 开 , 这 样 就 在 不 同 数字 上 或 不 同 数字 组 合 上 下 注 。 只 要 他 在 赌 桌 上 避免 
最 糟糕 的 赌注 (5 个 数字 )， 他 可 以 放松 地 确信 他 的 每 次 下 注 ， 赌 场 优势 仍旧 是 5.26%。 这 是 赌 徒 
不 用 担心 的 。 

事实 上 ， 单 一 的 布局 上 可 以 有 如 此 多 的 赌注 种 类 ， 以 至 于 不 会 有 幸运 的 偶然 事件 。 使 用 36 个 
数字 的 决定 是 明智 的 ， 毫 无 疑问 ， 它 是 多 年 以 前 制定 的 ， 因 为 有 大 量 的 因素 将 其 指向 数字 36。 当 
然 ,， 36 不 仅 可 以 被 1 整除 ， 也 可 被 >、3、4、6、9、12 和 18 整 除 ， 这 使 得 许多 简单 的 赌注 成 为 可 能 。 


J 46 在 21 点 游戏 中 赢 钱 
1 辆 


喜 许 对 统计 黑客 最 有 潜力 获 利 的 应 用 是 在 21 点 牌 菏 上 。 














在 21 点 游戏 中 ， 玩 家 的 目的 是 让 牌 的 总 和 比 庄家 的 牌 更 接近 21 点 〈 不 超过 21 点 )。 这 真 的 是 
一 个 简单 的 游戏 。 开 始 时 你 有 两 张 牌 ， 并 可 以 尽 可 能 多 地 要 牌 。 人 头 牌 的 值 10，A 的 值 可 以 是 1 
或 11， 其 他 牌 的 值 是 其 面值 。 

如 果 你 超过 21， 或 者 庄家 比 你 更 接近 (但 是 不 能 超出 )， 你 就 输 了 。 下 注 输 赢 的 机 会 均等 ， 
除非 得 到 一 个 黑 杰 克 : 两 张 牌 加 起 来 和 是 21 点 。 通 常情 况 下 ， 当 你 得 到 21 点 时 ， 你 获得 3 : 2 的 赔 
率 。 庄 家 有 一 个 优势 ， 即 他 在 你 行动 前 不 必 采 取 行 动 。 如 果 你 爆 了 (超过 21 )， 他 自动 获胜 。 

统计 学 家 可 以 通过 使 用 两 种 来 源 的 信息 , 来 明智 地 玩 这 个 游戏 : 庄家 牌 面 朝 上 的 牌 和 之 前 发 
的 牌 。 基 于 概率 的 基本 策略 会 让 聪明 的 玩家 不 必 太 注意 或 学 习 复 杂 的 系统 , 几乎 就 能 和 赌场 平等 
对 抗 。 考 虑 分 析 已 发 牌 的 方法 统称 为 算 牌 ， 使 用 这 些 方法 可 以 让 玩家 有 统计 优势 。 
































美国 法 院 裁 定 ， 在 赌场 里 算 牌 是 合法 ， 虽 然 赌 场 希望 你 不 要 算 牌 。 如 果 他 们 认为 你 
在 算 牌 ， 可 能 会 让 你 离开 这 个 游戏 ， 去 玩 一 些 其 他 游戏 ， 或 者 他 们 直接 禁止 你 进入 
赌场 。 他 们 有 权利 这 么 做 。 


4.6.1 基本 策略 


先 说 一 些 重要 内 容 。 表 4-12 给 出 了 依据 你 发 到 的 两 张 牌 和 庄家 牌 面 朝 上 的 牌 ，21 点 牌 合 适 的 
基本 玩法 。 大 多 数 的 赌场 允许 你 分 牌 ( 拿 到 一 对 牌 把 它 分 成 两 幅 单独 的 手 牌 ) 和 双 倍 下 注 (将 
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你 的 赌注 加 倍 ， 以 换取 再 拿 一 张 牌 的 机 会 )。 是 否 应 该 停牌 、 拿 牌 、 分 牌 或 双 倍 下 注 ， 取 决 于 你 





改进 或 损害 手 牌 的 可 能 性 ， 以 及 庄家 爆 牌 的 可 能 


表 4-12: 针对 庄家 明 牌 的 基本 21 点 策略 




































































你 的 手 牌 拿 牌 停牌 压 双 倍 分 牌 
5~8 总 是 

9 2,7~A 3~6 

10~11 10 或 A 2~9 

12 2、3、7~A 4-6 

13~16 7~A 2~6 

17~20 总 是 

22 8~A 

3、3 2、8~A 2~7 

4、4 2~5、7~A 6 
5、5 10 或 A 2~9 

6、6 7~A 2~6 
ee 8~A ee 
8、8 总 是 
9、9 2~6、8、9 7、10、A 
10、10 总 是 

A、A 总 是 
A、2 2~5、7~A 6 

A、3 或 A、4 2~4、7~A 5 或 6 

A、5 2 或 3 、7~A 4~6 

A、6 2、7~A 3~6 

A、7 9~A 2、7~A 3~6 

A、 8、 9、10 总 是 














在 表 4-12 中 ,，“ 你 的 手 牌 ” 指 两 张 已 经 发 给 你 的 牌 。 例 如 “5~8” 指 你 的 两 张 牌 加 和 
为 5、6、7 或 8。“A” 表 示 王 牌 A。 空 白 的 单元 格 表 示 你 不 应 该 选择 此 项 ,或 者 在 分 


牌 的 情况 下 ， 它 甚至 是 不 允许 的 。 
告诉 你 庄家 牌 如 何 时 ， 你 应 该 选择 的 策略 。 正 如 你 所 看 到 

















其 余 的 4 列 旦 现 的 是 典型 的 选项 ， 























的 ， 对 于 大 多 数 手 牌 只 有 部 分 选项 是 具有 统计 意义 的 。 此 表 显 示 了 最 佳 方案 , 但 并 不 是 所 有 的 
赌场 都 允许 你 在 有 任何 手 牌 时 压 双 倍 来 分 牌 。 但 是 ， 大 多 数 赌场 允许 你 拆 分 任何 一 对 有 牌 。 
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4.6.2 ”生效 原理 


和 表 4-12 中 的 决策 相关 的 概率 ， 是 由 一 些 核心 法 则 生成 的 : 
口 庄家 必须 一 直 要 牌 ， 直 到 他 达到 17 点 或 更 高 ; 
口 如 有 果 你 爆 牌 了 ， 那 你 就 输 了 ; 
口 如 果 庄 家 爆 牌 了 ， 但 你 没有 爆 ， 那 你 就 说 了 。 
因此 ， 主 要 策略 是 : 如 果 庄 家 有 可 能 爆 , 你 自己 就 不 要 冒险 。 相 反 ， 如 果 庄 家 可 能 有 很 好 的 
手 牌 ， 如 20， 你 应 该 尝试 提高 你 的 手 牌 。 能 给 你 带 来 最 大 获胜 几率 的 选项 在 表 4-12 里 。 
x 基于 很 多 常用 的 、 计 算 了 某 些 结果 发 生 概 率 的 表格 ， 我 们 给 出 了 这 些 建 议 。 表 格 里 
的 统计 数据 或 来 自 数 学 方法 ， 或 来 自 电脑 模拟 的 数 百 万 的 21 点 数据 。 









































这 里 有 一 个 例子 ， 从 中 可 以 看 出 当 庄 家 的 明 牌 是 6 点 ， 我 们 是 如 何 计算 概率 的 。 庄 家 的 暗 牌 
可 能 为 10 点 ， 这 实际 上 是 最 有 可 能 的 ， 因 为 人 头 牌 计 为 10。 如 果 庄 家 的 暗 牌 是 10 点 ,， 那 很 好 ， 因 
为 如 果 庄 家 开始 时 是 16 点 ， 他 会 爆 的 几率 约 为 62% ( 如 果 你 拿 到 16 点 ， 你 也 很 可 能 会 爆 )。 

由 于 有 8 张 不 同 的 牌 会 让 16 点 爆 掉 (6、7、8、9、10、J、Q 和 K )， 所 以 爆 牌 的 几率 计算 如 下 : 

8/13=0.616 

当然 ,最 理想 的 结果 就 是 庄家 有 一 张 10 点 的 瞳 牌 ,但 实际 上 庄家 的 上 暗 牌 不 为 10 点 的 几率 更 大 。 
暗 牌 是 其 他 牌 的 可 能 性 (9/13 ) 大 于 10 点 牌 (4/13 ) 的 几率 。 

除了 A， 任 何 牌 都 会 导致 庄家 继续 要 牌 。 下 一 张 牌 会 破坏 庄家 手 牌 的 几率 取决 于 庄家 的 实际 
起 手 牌 。 把 它们 全 部 加 在 一 起 , 庄家 的 明 牌 是 6 点 时 , 爆 牌 的 几率 不 到 62%。 庄家 的 明 牌 为 6 点 时 ， 
爆 牌 的 实际 几率 接近 42%， 这 意味 着 有 他 有 58% 几 率 不 会 爆 牌 。 

现在 ， 假 设 你 有 16 点 ， 庄 家 的 暗 牌 是 6 点 。 你 拿 一 张 牌 ， 爆 牌 的 几率 是 62%。 你 立马 输 掉 的 
几率 是 62%， 庄 家 获得 16 点 的 几率 是 $58%， 将 这 两 者 进行 对 比 。 因 为 相 比 不 要 牌 ， 要 牌 会 输 的 几 
率 更 大 ( 62 大 于 58 )， 你 应 该 在 庄家 6 点 时 停 叫 ， 如 表 4-12 所 示 。 

不 同 起 手 牌 对 庄家 明 牌 的 所 有 可 能 分 支 形 成 了 表 4-12 的 建议 。 









































傻 客 投注 〈sucker bet) 


如 果 庄 家 的 明 牌 是 A,， 许多 赌场 都 提供 机 会 让 你 买 保险 。 保险 意 味 着 你 下 原始 赌注 一 半 的 
赌注 ， 如 果 庄 家 有 一 个 黑 杰 克 ( 瞳 牌 是 10 或 人 头 牌 )， 那 么 你 就 赢 了 边 注 ， 但 是 输 掉 了 原始 赌 
注 ( 除 非 你 也 有 一 个 黑 杰 克 ， 这 种 情况 下 ， 你 们 打 成 平 手 ， 你 可 以 拿 回 你 的 赌注 )。 

庄家 有 一 张 10 点 瞳 牌 的 几率 是 4/13， 或 31%。 你 输 掉 保险 的 几率 要 比 你 赢 的 几率 更 高 。 除 
非 你 算 牌 ， 从 来 不 买 保险 。 是 的 ， 即 使 你 有 一 个 黑 杰 克 。 
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4.6.3 ”简单 的 算 牌 方法 


本 Hack 之 前 描述 的 基本 策略 的 前 提 是 ， 你 不 知道 牌 堆 里 还 剩 什 么 牌 。 不 管 是 使 用 单 副 牌 、 
6 副 牌 还 是 任意 副 牌 ， 在 特定 游戏 中 前 文 假定 牌 的 分 布依 然 是 原始 分 布 。 但 是 ， 发 牌 后 ， 不 管 发 
出 了 什么 牌 ,实际 的 概率 都 改变 了 ， 如果 你 知道 新 的 概率 ,对 于 如 何 玩 你 的 手 牌 也 许 会 有 不 同 的 
选择 。 

有 一 些 精巧 且 合 理 ( 统计 学 上 来 说 ) 的 方法 用 于 跟踪 之 前 发 的 牌 。 如 果 你 认真 学 习 这 些 方 法 ， 
让 自己 成 为 算 牌 员 , 你 就 有 更 多 的 机 会 和 优势 。 但 是 , 篇 幅 有 限 , 我 无 法 在 这 里 提供 一 个 完整 而 
全 面 的 系统 。 但 对 于 我 们 这 些 愿 意 增加 胜算 的 人 , 有 一 些 无 需 特别 努力 或 背诵 许多 图 表 就 能 提高 
胜算 几率 的 方法 可 供 利 用 。 

提高 获胜 几率 的 基本 方法 是 : 当 你 有 更 好 的 获胜 机 会 时 ， 增 加 你 的 赌注 。 你 必须 在 看 到 你 的 
牌 之 前 下 注 ， 所 以 当 你 的 赔 率 有 改善 时 ， 你 需要 提前 知道 。 我 们 按照 复杂 顺序 ， 分 别 讲解 以 下 3 
种 方法 ， 让 你 知道 什么 时 候 增加 赌注 。 













































































1. 算 A 

除非 你 被 发 到 黑 杰 元 , 否则 所 有 你 启 的 钱 都 是 你 下 注 的 钱 。 当 你 有 黑 杰 克 时 ,你 会 得 到 一 个 
3 : 2 的 支付 (例如 ， 每 10 美 元 的 赌注 赚 15 美 元 )。 因 此 ， 当 你 获得 黑 杰 克 的 几率 比 平均 几率 更 大 
时 ,你 可 能 要 冒 一 个 很 大 的 险 ， 下 比 平均 更 大 的 赌注 。 在 其 他 条 件 相 同 的 情况 下 ， 获 得 黑 杰 克 的 











几率 ， 是 通过 对 两 个 概率 求 和 得 到 : 
@ 先 得 到 一 张 10 点 牌 ， 然 后 得 到 一 张 A 
(4/13 ) x (4/51) =0.0241 
@ 先 得 到 一 张 A， 然 后 得 到 一 张 10 点 牌 
(1/13) x (16/51) =0.0241 


把 这 两 个 概率 加 在 一 起 , 你 会 得 到 0.0482 ( 约 5% ) 的 概率 , 这 是 你 的 起 手 牌 就 是 21 点 的 概率 ， 
也 叫 天 生 21 点 。 








很 显然 ， 除 非 牌 堆 里 有 A， 不 然 你 无 法 获得 黑 杰 克 。 当 A 发 完 后 ， 你 就 没有 机 会 获得 黑 杰 殉 
了 。 当 有 相对 较 少 的 A 时 ， 你 获得 黑 杰 克 几 率 也 就 较 小 。 一 副 牌 中 ， 如 果 先 发 出 了 一 个 A， 你 获 








黑 杰 克 的 几率 将 降 至 0.0362 ( 约 3.6% )。 如 果 发 完 1/4 的 牌 还 没 出 现 A， 你 获得 黑 杰 克 的 几率 将 
高 到 6.5%。 


高 欢 


nw 初 露头 角 的 算 牌 员 要 牢记 ， 不 要 动 你 的 嘴 层 。 
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2. 算 A 和 10 点 牌 

当然 ， 就 像 你 需要 一 个 A 来 获得 黑 杰 克 一 样 ， 你 还 需要 有 10 点 牌 ， 如 一 张 10、J、Q 或 K。 当 
你 在 算 A 时 ， 你 也 可 以 算 发 掉 了 多 少 张 10 点 牌 。 

A 和 10 点 牌 总 共有 20 张 ， 大 约 是 总 牌 数 的 38%。 当 发 完 一 半 牌 时 ， 这 20 张 牌 应 该 也 出 现 一 半 
了 。 如 果 发 出 的 这 些 关键 牌 少 于 10 张 ， 你 得 到 黑 杰 克 的 几率 会 随 之 增加 。 发 牌 过 半 时 ， 如 果 这 20 
张 牌 都 还 没 发 ， 你 得 到 黑 杰 克 的 几率 会 飙升 至 19.7%。 

3. 通过 点 数 系统 算 牌 

当 你 玩 牌 时 ， 你 想 要 更 多 比例 的 大 牌 3 ( high card ) 和 更 少 比 例 的 小 牌 4 (low card )， 一 个 简 
单 的 点 数 系 统 可 以 用 来 对 一 副 或 多 副 牌 持续 计 牌 。 这 上 比 简单 地 算 A 或 算 A 及 10 点 牌 ， 需 要 更 多 的 
脑力 和 专注 力 ， 但 它 提供 了 一 个 更 加 准确 的 指标 一 一 一 副 牌 什么 时 候 发 这 些 有 魔力 的 大 牌 。 


表 4-13 显 示 了 在 这 个 点 数 系统 下 ， 一 副 牌 中 每 张 牌 的 点 数值 。 























表 4-13 ”简单 的 算 牌 点 数 系统 





牌 点 值 
10、J.Q、 K、A -1 
7、8、9 0 
2、3、4、5、6 +1 





一 副 新 牌 以 0 开始 计数 ,因为 这 副 牌 中 要 发 的 -1 点 的 牌 和 1 点 的 牌 数量 相等 。 看 到 大 牌 是 不 好 
的 ,因为 这 意味 着 你 得 到 黑 杰 克 的 几率 有 所 下 降 ， 所 以 你 的 计数 里 失去 了 一 个 点 数 。 发 现 小 牌 是 
好 的 ， 因 为 这 意味 着 此 时 的 牌 里 有 更 多 比例 的 大 牌 ， 所 以 你 获得 一 个 点 数 。 





”你 可 以 通过 学 习 迅 速 识别 普通 对 子 牌 的 总 点 数 ， 更 高 效 和 容易 地 学 习 算 牌 。 一 张大 
牌 和 一 张 小 牌 可 以 相互 抵消 , 这 样 你 就 可 以 快速 处 理 并 忽略 这 类 手 牌 。 一 对 小 -小 的 
牌 值 为 大 点 (2 )， 一 对 大 -大 的 牌 很 麻烦 ， 这 意味 着 每 次 看 到 这 种 令 人 失望 的 组 合 ， 
你 都 要 减 去 2 点 。 
只 有 偶然 情况 下 ， 你 看 到 牌 会 使 计数 往 好 的 方向 大 幅 扭 转 。 计 数 很 少 会 远离 0。 例 如 ， 单 副 
新 牌 中 ， 前 6 张 牌 均 是 小 牌 的 几率 不 到 1%， 而 前 10 张 牌 均 是 小 牌 的 几率 约 是 1% 的 1/1000。 


但 是 , 计数 不 需要 很 高 就 能 够 将 你 获胜 的 几率 提高 到 足以 超越 仅 遵 循 基 本 策略 时 的 水 平 。 一 
副 牌 时 ，+2 的 计数 就 足够 大 到 可 以 有 效 提高 你 获胜 的 几率 。 多 于 一 副 牌 时 ,用 你 的 计数 除 以 牌 的 

















注 3: 10、T Q、K 和 A 被 称 作 大 牌 。 一 一 译 者 注 
注 4: 2、3、4、5 和 6 被 称 作 小 牌 。 一 一 译 者 注 
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副 数 ， 这 是 对 真正 计数 的 良好 估计 。 

即使 只 使 用 一 副 牌 ， 有 时 你 也 会 看 到 非常 高 的 计数 。 当 你 看 到 那 种 一 连 串 的 幸运 时 ,不 要 狂 
豫 , 提高 你 的 赌注 。 如 果 你 惯 于 使 用 点 数 系统 , 并 详细 了 解 这 些 系统 , 你 甚至 可 以 在 要 牌 、 停 牌 、 
分 牌 或 压 双 倍 时 改变 决策 。 

即使 你 只 是 使 用 这 些 简单 的 系统 ,也 会 在 21 点 赌 桌 上 提高 语 钱 的 几率 。 但 请 记 住 ， 即 使 使 用 
这 些 各 种 各 样 的 系统 , 在 赌场 还 有 其 他 陷阱 等 着 你 , 所 以 一 定 要 始终 遵循 其 他 好 的 赌博 建议 [Hack 
#35]。 




















I 4.7 聪明 地 买 彩票 
1 你 在 大 型 彩票 里 中 大 奖 的 几率 非常 非常 小 ,不 管 你 怎么 拆 分 这 个 大 奖 。 但 是 ， 你 确 
实 对 命运 有 一 定 的 控制 权 。 这 里 有 一 些 方法 能 使 你 相 比 其 他 没有 买 这 本 书 的 彩票 玩 
家 更 有 优势 (虽然 优势 是 欧 微 的 )。 


2005 年 10 月 ,最 大 的 强力 球 彩 票 (powerball lottery ) 得 主 被 加 冕 ， 并 被 授予 3.4 亿 美元 。 那 不 
是 我 。 我 不 买 彩 票 ， 因 为 作为 一 个 统计 学 家 ， 我 知道 ，( 相对 于 不 买 彩票 的 0 中 奖 几 率 , ) 买 只 是 
稍微 增加 了 我 中 奖 的 几率 。 这 一 点 几率 不 值得 我 这 么 做 。 

当然 ， 如 果 我 不 买 ， 我 就 不 可 能 中 奖 。 买 彩票 不 一 定 是 坏 的 赌博 ， 如 果 你 要 买 ， 你 可 以 做 几 
件 事 以 增加 你 赢 钱 (大概 ) 的 数量 并 提高 你 中 奖 (可 能 ) 的 几率 。 在 俄 勒 交州 的 杰克 逊 维 尔 ，10 
月 那天 ， 不管 是 谁 买 了 那 张 能 中 奖 3.4 亿 美元 的 彩票 ， 他 很 可 能 都 遵循 了 一 部 分 制胜 策略 ， 而 你 
也 应 该 遵循 这 些 制胜 策略 。 

因为 美国 大 多 数 州 都 有 强力 球 彩票 游戏 ， 所 以 我 们 把 它 作 为 例子 。 但是， 本 Hack 适 用 于 任何 


大 型 彩票 。 






































4.7.1 ”强力 球 赔 率 


像 很 多 彩票 一 样 ， 强力 球 要 求 玩 家 选择 一 组 号 码 。 然 后 抽取 随机 号 码 ， 如 果 你 匹配 部 分 或 全 
部 的 号 码 ， 你 就 启 钱 了 1! 为 赢得 最 大 的 奖金 ， 你 必须 匹配 很 多 号 码 。 因 为 有 这 么 多 人 玩 彩 票 ， 所 
以 售 出 了 很 多 彩票 ， 奖 金 也 因此 变 得 巨大 。 

当然 ,正确 地 选 出 所 有 中 奖 号 码 是 很 难 做 到 的 ,但 要 赢得 头 奖 ， 你 就 得 正确 地 选 出 所 有 中 奖 
号 码 。 在 强力 球 中 ， 你 先 选择 5 个 号 码 ， 然 后 选 第 六 个 号 码 : 红色 强力 球 。 常 规 白 色 号 码 的 范围 
是 1~55， 而 强力 球 范 围 是 1~42。 表 4-14 显 示 了 不 同 的 中 奖 组 合 、 奖 金 的 数额 ， 以 及 赢得 奖金 的 几 
率 和 百分比 。 


























4.7 聪明 地 买 彩票 147 





表 4-14: 强力 球 的 奖金 











匹配 奖金 几率 百分比 

只 有 强力 球 3 美元 1/69 1.4% 

1 个 白 球 和 强力 球 4 美元 1/127 0.8% 

3 个 白 球 7 美元 1/291 0.3% 

2 个 白 球 和 强力 球 7 美元 1/745 0.1% 

3 个 白 球 和 强力 球 100 美 元 1/11 927 0.008% 

4 个 白 球 100 美 元 1/14 254 0.007% 

4 个 白 球 和 强力 球 10 000 美 元 1/584 432 0.000 2% 

5 个 白 球 200 000 美 元 1/3 563 609 0.000 03% 

5 个 白 球 和 强力 球 特等 : 1/146 107 962 0.000 000 6% 











7.4.2 ”强力 球 的 奖金 

像 统 计 学 家 一 样 ， 用 你 现在 可 能 有 的 所 有 智慧 武装 自己 ( 除非 这 是 你 翻 到 的 本 书 的 第 一 个 
Hack )， 你 可 能 已 经 对 这 个 奖金 一 览 表 有 了 一 些 有 趣 发 现 。 

1. 最 容易 的 奖 

只 匹配 强力 球 就 能 赢得 最 容易 的 奖 , 即使 那样 , 获胜 的 希望 也 比较 池 茫 。 如 果 匹 配 强 力 球 ( 其 
他 数字 没有 匹配 )， 那 你 赢得 了 3 美元 。 赢 得 这 个 奖 的 几率 是 1/69。 

从 任何 理性 的 标准 来 看 , 这 都 不 是 一 个 很 好 的 赌注 。 因 为 你 花 了 一 美元 买 一 张 彩票 , 玩 一 次 ， 
期 望 奖 金 是 每 69 张 彩票 赢 3 美 元 。 因 此 ， 平 均 而 言 ，69 次 后 你 会 赢得 3 美元 ， 而 你 却 花 了 69 美 元 。 

其 实 ， 你 获得 的 奖金 会 比 这 多 一 点 。 表 4-14 所 示 的 几率 是 基于 一 个 特定 的 匹配 ， 不 考虑 其 他 
更 好 的 匹配 。 当 你 匹配 强力 球 时 ， 部 分 时 候 你 也 会 匹配 一 个 白 球 ， 这 时 你 的 回报 就 是 4 美元 ， 而 
不 是 3 美元 。 选 择 5 个 白色 球 号 码 ， 至 少 匹 配 一 个 的 几率 是 39%。 

因此 ， 匹 配 强力 球 之 后 ， 你 有 大 于 1/3 的 几率 会 至 少 匹 配 一 个 白 球 。 即 使 这 样 ， 你 的 预期 收 
益 大 约 是 每 扔 进 老鼠 洞 69 美 元 (我 的 意思 是 ， 花 在 彩票 上 ) 就 收益 3.39 美 元 ， 这 仍然 不 是 一 个 好 
的 赌注 。 

2. 只 匹配 强力 球 

只 匹配 强力 球 的 几率 似乎 并 不 完全 正确 。 我 说 过 ,强力 球 有 42 个 不 同 的 号 码 ， 所 以 概率 匹配 
怎么 会 是 1 : 69， 不 应 该 是 1 : 42 吗 ? 
是 的 , 但 请 记 住 表 中 展示 的 只 是 最 糟 情况 下 ( 没有 匹配 其 他 的 球 ) 获得 的 奖金 。 如 果 你 把 所 
有 中 奖 可 能 组 合 在 一 起 ， 你 得 到 奖金 的 几率 是 1 : 37，3% 左 右 。 依 然 不 是 一 个 好 的 赌注 。 
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3. 巨 奖 

巨 奖 的 几率 似乎 也 并 不 完全 正确 (好 吧 , 好 吧 , 我 真 的 不 希望 你 已 经 “注意 到 ”了 。 我 是 直 
到 做 了 一 些 计算 后 才 注 意 到 。 ) 

如 果 从 1~55 号 ( 白 球 ) 中 抽出 5 个 ， 从 1~42 号 ( 红 球 ) 中 抽出 1 个 ,然后 做 个 快速 计算 ,估计 
号 码 的 可 能 性 : 





























55x55x55x55x55x42=21 137 943 750 
换 名 话说， 几率 是 1 : 21 137 943 750。 或 者 ， 如 果 你 想 的 更 清楚 一 点 ， 意 识 到 随 着 号 码 被 抽 
出 ， 号 码 的 总 数 变 小 ， 你 可 能 会 迅速 计算 可 能 的 结果 为 : 
55 x54x53x52x51x42=17 532 955 440 
表格 中 显示 的 几率 要 比 1 : 17 532 955 440 好 点 。 我 第 一 次 计算 几率 时 ， 没 有 意识 到 号 码 顺序 
并 不 重要 ， 所 以 任何 剩余 的 号 码 可 能 会 在 任何 时 候 出 现 。 因 此 ， 下 面 才 是 正确 的 计算 结 
(5/55) x (4/54) x (3/53) x (2/52) x (1/51) x (1/42)=1/146 107 962 


4.7.3 ”赢得 强力 球 


好 了 ,你 可 能 认为 ) 这 些 统计 信息 想 要 告诉 我 们 ， 我 们 不 应 该 再 玩 彩票 了 ， 因 为 ， 从 统计 
学 上 来 看 ， 几 率 永远 不 会 对 我 们 有 利 。 其 实 ， 用 公平 支付 的 标准 来 看 ， 有 一 个 时 机 可 以 玩 ， 并 要 
尽 可 能 多 地 买 彩票 。 

在 强力 球 游戏 中 , 当 巨 奖 超过 146 107 962 美 元 时 ( 或 两 倍 的 金额 ,如果 你 要 一 次 性 领取 奖金 )， 
你 应 该 买 。 只 要 它 达到 了 146 107 963 美 元 ， 买 ， 买 ， 买 ! 因为 从 统计 角度 来 看 , 匹配 $ 个 白 球 和 1 
个 红 球 的 几率 ， 正 好 是 1 比 上 那个 大 数字 ， 当 你 的 奖金 比 那 个 数字 大 的 时 候 ， 它 都 是 一 个 不 错 的 
赌注 。 

对 于 强力 球 和 球 的 号 码 还 有 值 的 范围 ，146 107 962 是 一 个 神奇 的 数字 。 有 观点 认为 ， 你 获奖 
的 几率 并 没有 改变 , 但 回报 金额 已 增加 至 一 个 水 平 ， 在 这 个 水 平 上 ,是 值得 买 的 ,这 类 似 扑克 底 
池 赔 率 的 概念 [Hack #37]。 




































































你 可 以 计算 出 任何 彩票 的 “神奇 数字 ”。 一 旦 该 彩票 的 回报 高 于 这 个 数字 ， 你 就 可 
ww 以 有 理由 地 买 一 张 彩票 。 使 用 我 们 例子 中 的 “正确 系列 ”的 计算 作为 你 的 数学 指导 。 
问 问 自己 有 多 少 号 码 必 须 匹 配 ， 可 能 的 号 码 范围 是 什么 。 请 记 住 ， 每 次 你 抽出 一 个 
球 或 号 码 时 ， 就 将 你 要 除 的 那个 数 减 1， 除 非 号 码 可 以 重复 。 如 果 号 码 可 以 重复 ， 

那么 在 你 的 连 乘 中 分 母 保持 不 变 。 
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至 于 何 时 购买 彩票 ， 和 计算 的 实际 魔法 数字 、 促 使 你 无 节制 地 购买 彩票 的 奖金 数量 有 关 。 宣 
传 的 所 谓 头 奖金 额 ,， 其 实 并 不 是 头 奖 。 宣 传 的 “ 头 奖 ”其 实 是 若干 年 里 获奖 者 领取 的 一 系列 部 分 
奖金 的 总 额 。 在 赌博 和 统计 意义 上 , 你 确认 的 金额 ， 即 真正 的 头 奖 是 如 果 你 选择 一 次 性 奖金 会 万 
得 的 金额 。 一 次 性 奖金 通常 比 宣传 的 头 奖 金额 的 一 半 还 少 一 点 。 

所 以 ,如 果 你 已 经 确定 ， 你 要 买 的 彩票 已 经 增长 到 了 头 奖金 额 , 现在 在 统计 学 上 是 个 购买 好 
时 机 , 那么 你 应 该 买 多 少 彩票 ? 为 什么 不 每 一 个 都 买 ? 为 什么 不 花 146 107 962 美 元 买 每 个 可 能 的 
组 合 ” 保证 你 会 中 奖 。 如 果 头 奖 大 于 这 个 数额 ， 那 么 你 会 赢 钱 ， 一 定 的 ， 对 吧 ?” 嗯 ， 其 实 不 是 。 
否则 , 我 会 很 有 钱 , 我 也 绝 不 会 跟 你 分 享 这 个 技巧 。 为 什么 不 能 保证 你 赢 ? 可 能 的 情况 是 你 会 被 
迫 拆 分 奖金 ! 请 看 下 节 …… 















































4.7.4 不 要 拆 分 奖金 


如 果 你 的 彩票 的 确 中 奖 了 , 那 你 希望 自己 是 唯一 的 赢家 , 所 以 除了 决定 何 时 买 ， 还 有 各 种 的 
策略 来 提高 这 个 中 奖 号 码 仅 归 你 所 有 的 可 能 性 。 

首先 ,我 们 假设 : 中 奖 号 码 是 随机 选取 的 。 我 不 想 成 为 一 个 阴谋 论 者 ,我 也 不 相信 上 帝 有 时 
间或 愿意 影响 彩票 中 奖 号 码 的 抽取 ， 所 以 我 不 会 列 出 任何 只 在 非 随 机 抽取 中 奖 号 码 下 生效 的 战 
略 。 在 你 考虑 如 何 选择 彩票 号 码 时 ， 这 里 有 一 些 合理 的 提示 。 

@ 电脑 选号 

让 电脑 选 , 或 者 ,至 少 自己 选择 随机 数 。 随 机 数 对 其 他 玩家 具有 意义 的 可 能 较 小 ， 所 以 他 们 
不 太 可 能 将 随机 数字 选 作 他 们 自己 的 彩票 号 码 。 强 力 球 的 人 报告 说 ， 所 有 中 奖 彩票 中 70% 是 由 店 
内 电脑 选 出 的 。( 他 们 还 指出 ， 在 “我 们 告诉 你 ， 结 果 是 随机 的 ”有 点 异想天开 的 想法 中 ， 所 有 
购买 的 彩票 70% 是 由 计算 机 产生 的 )。 

@ 不 选 日 期 

不 选 可 能 是 日 期 的 数字 。 如 果 可 能 ， 避 免 小 于 32 的 数字 。 很 多 玩家 总 是 选 重要 的 日 期 ， 如 生 
日 、 纪 念 日 以 及 出 狱 日 期 ， 等 等 。 如 果 你 的 中 奖 号 码 是 别人 的 幸运 日 ， 就 增加 了 你 将 不 得 不 分 割 
你 奖金 的 几率 。 

@ 远离 知名 号 码 

不 要 挑 那 些 众所周知 的 数字 。 在 2005 年 10 月 的 强力 球 结果 中 , 数 百名 玩家 选择 在 热 映 的 科幻 
电视 剧 《 迷 失 》 中 起 重大 作用 的 数字 ,作为 他 们 的 彩票 号 码 。 这 些 人 没 能 荣获 大 奖 , 但 如 果 他 们 
启 得 了 大 奖 ， 他 们 将 不 得 不 把 百 万 奖金 分 割 成 数 百 片 。 
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_ 还 有 一 系列 纯粹 的 哲学 技巧 ， 和 因果 的 抽象 理论 以 及 现实 的 本 质 有 关 。 例 如 ， 有 些 
a pe es 因为 ,虽然 你 可 能 不 确定 知道 什么 是 真实 的 ,在 
这 个 世界 上 什么 能 发 生 ， 什 么 不 能 发 生 ， 但 你 至 少 知道 ， 上 周 的 中 奖 号 码 是 有 可 能 

成 为 本 周 中 奖 号 码 的 。 we， 它 可 能 会 再 次 发 生 。 





虽然 你 赢得 大 奖 的 几率 微乎其微 , 但 你 可 以 遵循 一 些 统计 学 原理 , 做 一 些 事情 来 真正 掌握 自 
己 的 命运 。( 顺便 说 一 句 ， 在 意大利 语 中 命运 的 单词 是 乐 透 lotto。 ) 哦 ， 还 有 一 件 事 : 在 开奖 日 当 
天 买 彩票 。 如 果 你 购买 彩票 的 时 间 踊 获奖 号 码 公布 时 间 还 有 很 长 ， 相 比 你 赢得 头 奖 的 几率 , 你 有 
更 大 的 几率 会 被 雷电 击 中 、 在 浴 仙 中 少 水 或 被 一 辆 小 货车 撞 到 。 时 间 就 是 一 切 ， 我 不 希望 你 错过 
机 会 。 














a J 4.8 好 运 玩 牌 
的 克 叔 上 花费 很 多 时 间 在 酒馆 里 玩 朋 子 赢 思 生 的 酒吧 注 ， 还 有 冲 女 士 们 发 出 本 人 
微笑 ， 有 虽然 过 是 事实 ， 但 他 的 生 洗 比 这 丰富 。 比 如 ， 有 时 候 他 玩 扑 克 ， 不 玩 股 子 。 


人 们 往往 对 不 同 组 合 牌 出 现 可 能 性 的 理解 水 平 自我 感觉 良好 ， 尤 其 是 卡 牌 玩家 和 扑克 玩家 。 
他 们 的 经 验 已 经 告诉 他 们 , 一 对 、 三 条 及 同 花 等 很 少 出 现 。 但 是 , 将 这 种 直观 知识 运用 到 本 游戏 
情境 之 外 的 其 他 卡 牌 问题 是 困难 的 。 


我 那 精 于 统计 的 弗兰克 叔叔 知道 这 一 点 。 有 时 候 ， 弗 兰 克 权 虑 ,我 很 抱 茹 地 说 ， 用 他 的 统计 
知识 作恶 , 不 作 善 , 他 已 经 启 得 了 一 批 使 用 扑克 牌 的 酒吧 投注 , 并 声称 这 帮 他 支付 了 研究 生 学 费 。 
我 在 此 与 大 家 分 享 , 目的 只 是 为 了 证 明 某 些 基本 统计 原则 。 我 相信 你 会 用 新 学 到 的 知识 取悦 别人 ， 
打击 犯罪 , 或 万 得 廉价 的 非 酒 精 饮料 。 

















4.8.1 获得 小 同 花 


在 扑克 中 ， 同 花 是 $ 张 花色 相同 的 牌 。 不 过 ， 对 于 我 的 叔叔 弗兰克 ， 不 管 他 在 什么 地 方 ， 在 
他 被 要 求 离开 前 , 很 少 有 时 间 能 发 完 所 有 的 手 牌 。 因 此 ,弗兰克 叔叔 常 基于 他 所 谓 的 小 同 花 ( 了] 
flushes ) 下 注 。 

1. 投注 

一 个 小 的 同 花 ( 哎呀, 对 不 起 , 我 的 意思 是 小 同 花 ) 是 任意 两 张 相 同 花 色 的 牌 。 弗 兰 克 喜欢 
打 一 个 财 ， 几 乎 总 能 赢 ， 那 就 是 在 你 手 牌 里 发 现 两 张 相 同 花 色 的 手 牌 。 此 外 ， 由 于 时 间 限 制 ， 他 
的 扑克 手 牌 只 有 4 张 ， 而 不 是 5 张 。 


赌注 是 ， 你 从 一 堆 随 机 牌 里 发 给 我 4 张 牌 ， 我 会 得 到 至 少 两 张 同一 花色 的 牌 。 虽 然 这 似乎 不 
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太 可 能 ,但 实际 上 4 张 牧 花色 都 不 同 的 几率 更 小 ,我 算 过 ,一 手 4 张 牌 ,花色 不 同 的 几率 大 约 是 11%。 
所 以 ,得 到 一 个 小 同 花 的 几率 大 约 是 89%1 

2. 生效 原理 

有 不 同 的 方式 计算 扑克 有 牌 手 牌 的 概率 。 对 于 这 个 酒吧 赌注 ,我 用 的 方法 是 这 样 的 : 数 出 可 能 
获胜 手 牌 组 合 的 数量 , 并 和 所 有 手 牌 组 合 的 总 数 相 比较 。 这 是 在 “好 运 玩 崩 子 ” 里 使 用 [Hack #43] 
的 方法 。 

为 了 计算 4 张 牌 代表 4 种 不 同 花 色 , 即 它们 之 间 没 有 两 张 牌 同 花 的 几率 , 我 们 先 计算 出 可 能 的 
4 张 牌 的 组 合 数量 。 试 想 一 下 ,任何 第 一 张 牌 ( 有 52 种 可 能 )， 这 张 牌 与 任何 剩余 的 第 二 张 牌 (52 
x51 )， 加 上 第 三 张 牌 (52 x 51 x 50 ) 和 第 四 张 牌 (52 x 51 x 50 x 49 )， 你 会 得 到 共计 6 497 400 
种 4 张 手 牌 的 不 同 组 合 。 


接 下 来 ， 想 象 4 张 手 牌 的 前 两 张 牌 。 它 们 花色 相同 的 几率 只 有 0.235 2 ( 51 张 牌 中 依然 还 有 12 
张 是 同一 花色 )。 因 此 ， 在 所 有 可 能 的 4 张 手 牌 组 合 里 ， 大 约 有 150 万 的 组 合 会 在 头 两 张 牌 里 形成 
同 花 。 它 们 不 是 同 花 的 几率 是 0.764 8。 这 使 得 头 两 张 牌 是 不 同 花 色 的 可 能 数量 是 4 968 601。 

这 一 数量 中 , 有 多 少 不 会 收 到 和 前 两 张 牌 花色 都 不 同 的 第 三 张 牌 ? 还 剩余 5$0 张 牌 ，50 张 牌 中 
有 26 张 有 还 没 出 现 过 的 花色 。 所 以 ， 第 三 张 牌 和 前 两 张 花色 都 不 相同 的 几率 是 26/50 ( 52% )。 

这 使 得 前 3 张 牌 花色 都 不 相同 的 组 合 数量 变 成 2 583 673 。 现 在 ， 这 个 数字 里 ， 有 多 少 会 抽出 
第 四 张 牌 是 第 四 种 没 出 现 的 花色 ? 剩 下 的 49 张 牌 中 有 13 张 代表 了 最 终 的 第 四 种 花色 。 剩 下 的 手 牌 
中 26.53% 的 牌 将 和 第 四 张 牌 花色 一 样 ， 4 种 不同 花 色 的 组 合 数量 达到 了 685 464。685 464 除 以 可 能 
的 手 牌 组 合 总 数 ， 结 果 是 0.105 5 ( 685 464/6 497 400 )。 

4 张 手 牌 有 4 种 不 同 花 色 的 几率 是 11%。 哎呀 ! 顺便 说 一 下 ， 一 些 超级 天 才 可 以 只 使 用 相关 比 
例 ， 就 能 得 到 相同 的 结果 ， 这 也 是 我 们 在 不 同 的 计数 阶段 一 直 用 的 方法 ， 根 本 不 必 计 算 : 

0.764 8 x 0.52 x 0.365 3=0.105 5 








































































































4.8.2 ”寻找 两 副 牌 的 匹配 

你 有 一 副 扑 克 牌 ， 我 也 有 一 副 扑 克 牌 。 这 两 副 牌 都 洗 过 了 。 如 果 我 们 一 次 把 它们 发 完 ， 即 一 次 
性 将 两 副 牌 都 发 完 ， 它们 会 有 匹配 吗 ? 我 的 意思 是 ,他们 会 完全 匹配 吗 ? 相同 的 牌 , 例如 , 我 们 两 
个 都 同时 出 现 方 片 ]? 

1. 投注 

大 多 数 人 会 说 没有 , 或 者 至 少 它 会 偶尔 发 生 , 但 一 定 不 会 太 频繁 。 邻 人 吃惊 的 是 ， 当 你 发 两 副 
牌 时 , 你 会 频繁 发 现 至 少 一 对 , 而 不 频繁 发 现 倒 是 不 寻常 的 。 如 果 你 进行 这 样 的 下 注 或 进行 很 多 次 
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这 项 实验 , 在 大 多 数 情 况 下 你 将 获得 至 少 一 对 匹配 。 事实 上 , 只 有 36.4% 的 几率 你 找 不 到 一 对 匹配 | 

2. 生效 原理 

以 下 讲解 如 何 从 统计 角度 思考 这 个 问题 。 因 为 牌 被 洗 过 , 所 以 可 以 假定 任何 两 张 被 翻转 的 牌 
代表 的 都 是 从 两 幅 牌 这 个 理论 总 体 中 抽取 的 随机 样本 。 对 于 任何 给 定 的 一 对 牌 , 可 以 算出 这 对 牌 
匹配 的 概率 。 因 为 你 抽样 52 次 , 在 这 些 抽 样 中 得 到 匹配 的 几率 会 随 着 抽样 次 数 的 增加 而 提高 。 就 
像 扔 一 对 货 子 得 到 7 一 样 : 在 任意 给 定 的 一 次 投掷 下 ， 它 不 太 可 能 ， 但 随 着 投掷 次 数 的 增多 ， 它 
变 得 非常 可 能 了 。 

为 了 计算 一 系列 结果 中 , 命中 某 人 和 希望 结果 的 概率 , 我 们 先 计算 尝试 若干 次 都 没有 得 到 希望 
结果 的 概率 ,这样 数学 运算 会 简单 一 点 。 对 于 任何 给 定 的 牌 ， 该 牌 在 另 一 副 牌 完全 配对 的 几率 是 
1 : 52。 不 配对 的 几率 是 51 : 52， 或 0.980 8。 

但 是 ， 你 不 止 一 次 尝试 配对 ， 你 尝试 了 52 次 。 那 么 ，52 次 尝试 都 没 得 到 一 对 匹配 的 概率 是 
0.980 8 的 52 次 方 。 用 数学 语言 表达 就 是 0.980 8 了 。 

等 一 秒 钟 , 我 会 在 脑 中 计算 ( 0.980 8 乘 以 0.980 8 乘 以 0.980 8, 以 此 类 推 ,，52 次 结果 约 为 0.364 3 )。 
好 吧 ， 所 以 它 不 会 发 生 的 几率 是 0.364 3。 为 了 得 到 它 发 生 的 几率 ， 我 们 用 1 减 去 这 个 数字 ， 得 到 
0.635 7。 

你 会 发 现在 两 副 牌 中 ， 约 2/3 的 几率 会 至 少 有 一 对 匹配 ! 非常 好 。 去 赢 免 费 的 柠檬 水 吧 。 





























i 到 4.9 玩 般 子 行 大 运 
下 面 是 一 些 用 旋 实 的 租 子 进行 的 诚实 赌注 。 但是， 这 只 是 说 明 你 没有 作弊 ， 并 不 意 
味 着 你 不 会 赢 。 

人 们 对 统计 学 家 有 一 个 不 幸 的 刻板 印象 : 戴 眼 镜 的 内 向 书 呆 子 ,永远 不 会 和 大 家 一 起 喝 啤酒 。 
这 是 如 此 落 雇 的 想法 , 以 至 于 上 周 六 、 日 , 我 在 《 龙 与 地 下 城 》 的 每 周 例 行 聚会 中 ， 只 想到 这 点 ， 
就 大 笑 不 止 ， 筑 得 我 的 单 片 眼镜 差点 掉 进 雪 利 酒 里 。 

事实 是 ， 在 酒吧 里 展示 简单 的 概率 知识 ， 会 让 顾客 感觉 非常 有 趣 ， 会 使 你 成 为 聚会 的 焦点 。 
至 少 , 对 于 我 叔叔 弗兰克 而 言 确实 是 这 样 的 , 他 多 年 来 一 直 用 他 的 统计 技巧 来 赢得 免费 的 饮料 和 
腌 蛋 (或 任何 那 种 在 大 饶 里 的 东西 ， 总 是 在 电视 上 能 看 到 它们 在 酒吧 里 )。 

这 里 有 一 些 使 用 任何 一 对 公平 的 山子 都 能 赢得 赌注 的 方法 。 
































4.9.1 冉 子 的 结果 分 布 


首先 ， 让 我 们 熟悉 投掷 两 个 仙 子 可 能 出 现 的 结果 。 你 应 该 知道 ， 大 多 数 仍 子 有 6 个 面 〈 我 把 
它 幻想 成 进行 角色 扮演 的 朋友 ， 并 称 作 六 面 贷 子 )，6 个 面 分 别 代表 1~6。 
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计算 可 能 的 结果 不 过 是 列 出 这 些 结果 , 并 计算 它们 ,图 4-2 显 示 了 撕 两 个 骨 子 的 所 有 可 能 结果 。 




















掷 出 3 锋 出 3 扼 出 4 扼 出 3 扼 出 6 扼 出 7 基 出 3 扼 出 9 移 电 | 效 岂 | 掀 电 
有 1 利 有 2 利 | 有 3 种 | 有 4 利 | 有 5 利 有 6 和 | 有 5 和 | 有 4 利 | 3 机 | 2 机 | 2 
全 方式 方式 方式 方式 方式 访 式 方式 | 四 | 生生 
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图 4-2: 掷 两 个 货 子 可 能 的 结果 
这 种 分 布 形 成 了 表 4-15 所 示 的 频率 。 


表 4-15: 投 搂 两 个 角 子 结果 的 频率 











总 投掷 数 组 合 数 频 率 
2 1 2.8% 
3 2 5.6% 
4 3 8.3% 
5 4 11.1% 
6 5 13.9% 
7 6 16.7% 
8 5 13.9% 
9 4 11.1% 
10 3 8.3% 
11 2 5.6% 
12 1 2.8% 
可 能 结果 的 总 数 36 100% 


当然 ， 掷 般 子 的 游戏 完全 基于 这 些 期 望 频率 ( expected frequency )。 当 你 看 这 个 频率 分 布 时 ， 
可 能 会 想到 一 些 有 趣 的 赌注 。 例 如 ， 虽 然 7 点 是 最 常见 的 投掷 结果 ， 很 多 人 也 都 知道 这 一 点 ， 但 
它 只 是 比 6 或 8 稍微 高 一 点 。 


实 上 ， 如 果 你 不 需要 对 某 个 具体 数字 下 注 ， 你 可 以 赌 在 出 现 一 个 7 之 前 会 出 现 一 个 6 或 8。 


RN 所 有 两 个 山子 之 和 中 ， 有 超过 1/4 的 几率 ( 约 28% ) 会 是 6 或 8。 这 实质 上 比 
和 为 7 的 可 能 性 要 大 ， 出 现 7 的 几率 只 有 1/6。 








血 











4.9.2 ”用 骨 子 进行 酒吧 投注 
我 的 叔叔 弗兰克 以 前 经 常 和 一 些 迟 钝 的 顾客 打赌 ， 说 在 顾客 撕 得 一 个 7 以 前 ， 会 所 得 一 个 
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或 9。14 次 打 财 中， 弗兰克 叔叔 会 赢得 8 次 。 

有 时 候 ， 老 弗兰克 打赌 说 ， 将 一 对 般 子 投掷 一 次 ， 会 出 现 6 或 1。 不 过 ， 人 们 首先 想到 的 是 ， 
似乎 此 情况 发 生 的 几率 至 少 低 于 $0%， 事 实 上 ， 出 现 一 个 1 或 6 的 几率 约 为 56%。 顺 便 说 一 下 ， 任 
何 两 个 不 同 的 号 码 出 现 的 概率 与 之 相同 , 所 以 你 可 以 用 一 个 具有 吸引 力 的 陌生 人 的 生日 来 挑选 数 
字 ， 也 许 因 此 开启 你 们 之 间 的 对 话 ， 使 得 你 们 结婚 ， 育 有 子女 ， 或 两 者 兼 而 有 之 。 


如 果 你 比 我 板 板 弗兰克 更 诚实 (你 有 98% 的 可 能 性 比 他 诚实 )， 这 里 有 一 些 输赢 参半 的 仍 子 
投注 。A 列 结果 和 B 列 结果 发 生 的 可 能 性 相同 : 




















A B 
2 或 12 3 
2、3 或 4 7 
5、6 或 7 8、9、10、11 或 12 


对 任何 一 种 结果 ， 胜 负 的 几率 是 相同 的 。 


4.9.3 生效 原理 
对 于 这 个 Hack 展 示 的 赌注 ， 下 面 是 计算 的 获胜 概率 : 








赌 注 获胜 结果 数量 计算 结果 比例 
5 或 9 vs 7 8vs6 8/14 0.571 
出 现 1 或 6 20 20/36 0.556 
2 或 12 vs 3 2vs2 2/4 0.500 
2、3 或 4vs 7 6vs6 6/12 0.500 
5、6 或 7 vs 8 或 更 高 15 vs 15 15/30 0.500 


“赌注 ”列表 示 两 个 有 苋 争 关系 的 结果 。( 例如 ,得 到 7 之 前 会 得 到 一 个 5 或 9 吗 ? ) “获胜 结 
数量 ” 列 展 示 两 种 情况 下 不 同 投掷 结果 的 数量 (例如 ，8 次 获得 一 个 5 或 9，6 次 获得 一 个 7 )。“ 结 
果 比 例 “ 栏 表示 你 获胜 的 几率 。 

你 可 以 通过 这 些 各 种 各 样 的 赌注 ， 用 两 种 不 同 的 方式 获胜 。 如 果 是 胜 负 几 率 均等 的 下 注 ， 从 
长 远 来 看 , 你 可 以 通过 比 对 手 少 下 注 来 赚 取 利润 。 他 不 会 知道 胜 负 几率 是 均等 的 。 但 是 ,如果 几 
率 有 利于 你 ， 你 就 要 考虑 给 你 的 目标 提供 稍微 好 点 的 回报 ， 或 选择 很 可 能 更 频繁 出 现 的 结果 。 





























J 4.10 提高 卡 牌 的 杀伤 力 
FLV 在 得 州 扑克 和 其 他 扑克 游戏 中 ， 有 几 个 初步 的 技巧 以 及 关于 概率 的 一 点 基本 知识 ,会 立 
刻 把 你 从 绝对 初学 者 推动 到 更 高 超 的 水 平 ， 甚至 使 你 被 当做 作 商 财 徒 而 陷入 麻烦 。 
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在 一 些 重要 方面 ， 出 现在 电视 上 的 专业 得 州 扑克 玩家 跟 我 们 有 所 不 同 。( 好 吧 ， 他 们 可 能 和 
你 只 在 几 个 重要 方面 有 所 不 同 ; 他 们 和 我 在 很 多 重要 方面 都 不 同 , 以 至 于 即使 我 的 大 脑 像 电脑 一 
样 也 无 法 达到 那么 高 的 水 平 。) 下 面 是 他 们 玩 扑克 时 已 经 掌握 的 两 种 技能 : 
口 知道 在 不 同 阶段 ( 翻 牌 、 河 牌 ， 等 等 ) 获得 他 们 想 要 的 牌 的 粗略 概率 ; 
口 快速 识别 也 许 被 其 他 玩家 持 有 的 可 能 更 好 的 手 牌 。 

本 Hack 介 绍 一 些 技巧 和 工具 可 以 助 你 从 新 手 转 变 为 半 职 业 玩家 。 这 些 都 是 一 些 简单 好 用 的 知 
识 和 帮 你 快速 作出 决策 的 经 验 规则 。 就 像 这 本 书 中 的 其 他 扑克 Hack 一 样 , 它们 提供 的 策略 技巧 完 
全 基于 统计 概率 ， 即 假定 一 副 标 准 扑克 的 52 张 牌 是 随机 分 布 的 。 



































4.10.1 改善 你 的 手 牌 


在 得 州 扑 克 中 ,你 有 一 半 的 时 间 会 得 到 对 子 或 更 好 的 手 牌 。 我 会 重复 一 遍 ， 因 为 这 对 理解 游 
戏 很 重要 。 一 半 的 时 间 (实际 略 低 于 5$2% )， 如 果 你 留 在 赌 桌 旁 的 时 间 足 够 长 ，7 张 牌 (你 的 两 张 
牌 ， 加 上 所 有 5 张 公共 牌 ) 中 你 将 至 少 有 一 个 对 子 。 它 可 能 一 直 在 你 的 手 牌 里 ( 称 为 口 裳 对 子 ; 或 
连接 对 子 " )， 也 可 能 由 手 牌 中 的 一 张 和 公共 牌 中 一 张 组 成 ， 或 者 全 都 来 自在 大 家 都 可 以 叫 的 公共 
牌 里 。 

如 果 多 数 时 候 , 每 个 玩家 发 到 7 张 牌 , 平均 每 个 玩家 都 会 有 一 对 , 那么 有 一 对 低 对 ( low pair ) 
却 要 坚持 到 结束 的 你 可 能 会 输 ， 当 然 , 这 只 是 从 统计 学 上 来 讲 。 换 句 话 说， 另 一 个 玩家 至 少 有 一 
对 的 几率 大 于 50%， 并 且 这 一 对 可 能 是 对 8 或 更 高 的 对 子 ( 13 对 中 只 有 6 对 是 对 7 或 更 低 的 对 子 。) 

对 子 的 常见 性 解释 了 为 什么 A 被 高 度 重视 。 很 多 时 候 ， 翻 牌 (head-up ) 战斗 归根 结 底 是 对 子 
和 对 子 间 的 较量 。 男 一 个 很 好 的 时 间 比 例 是 ，A 作 为 起 脚 牌 或 在 决胜 局 中 起 着 重要 的 作用 。 有 A 
是 好 事 ， 这 一 切 都 因为 概率 。 

1. 概率 

如 果 你 知道 一 些 常 见 期 望 结 果 的 常见 概率 , 就 可 以 更 明智 地 作出 这 样 的 决定 : 在 试图 降低 对 
手数 量 时 应 该 停牌 还 是 加 注 。 表 4-16 列 出 了 抽 到 的 那 张 牌 能 在 不 同 阶 段 提高 你 的 手 牌 的 概率 。 这 
个 概率 根据 一 副 牌 里 还 剩 多 少 牌 、 多 少 不 同 的 牌 可 帮 你 (你 的 出 路 牌 )， 以 及 还 会 发 多 少 牌 计算 
而 和 得。 例如， 如果 你 有 一 个 A~K， 希望 配对 ， 有 6 张 牌 可 以 配对 ， 换 句 话 说 ,你 有 6 张 出 路 牌 。 如 
果 你 只 有 一 张大 牌 A4， 但 希望 能 找到 另外 一 张 A， 那 你 就 有 3 张 出 路 牌 。 如 果 你 有 一 对 口袋 对 子 ， 
并 希望 在 公共 牌 里 找到 强大 的 第 三 张 牌 ， 你 只 有 两 张 出 路 牌 。 









































注 5: 在 得 州 扑克 中 ， 口 袋 对 子 〈English Pocket Pair ) 是 由 玩家 的 两 张 底牌 构成 的 对 子 。 一 一 译 者 注 
注 6: 连接 对 子 ( wired pair ) 是 由 一 个 玩家 的 第 一 张 和 第 二 张 牌 组 成 的 对 子 。 一 一 译 者 注 
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表 4-16: 改善 手 牌 的 概率 





剩余 发 牌 数 6 张 出 路 牌 3 张 出 路 牌 2 张 出 路 牌 
5 ( 翻 牌 前 ) 49% 28% 19% 
2 ( 翻 牌 后 ) 24% 12% 8% 
1 ( 转 牌 后 ) 13% 7% 4% 


这 里 摘 述 的 情况 假设 你 发 到 了 两 张 牌 。 毕 部, 在 大 多 数 扑 元 游戏 中 ,在 翻 牌 前 下 注 是 预计 好 
的 , 不 需要 做 任何 决定 。 顺便 说 一 下 ， 因 为 你 希望 通过 翻 牌 改善 自己 手中 未 成 气候 的 牌 所 以 你 
想 知道 翻 牌 可 能 改善 手 牌 的 几率 。 它 们 分 别 是 : 


























剩余 出 路 牌 在 翻 牌 中 得 到 获胜 牌 的 几率 
6 32% 
3 17% 
2 12% 
2. 启示 





根据 表 4-16 中 所 述 的 分 布 ， 这 里 有 几 个 你 应 该 牢记 心中 的 简单 的 观察 和 局 示 。 

一 半 的 时 候 ， 你 会 配对 。 这 对 大 有 牌 来 说 是 正确 的 ， 如 A~K 或 小 牌 ， 如 2~7。 你 甚至 可 以 选择 
对 已 有 的 两 张 牌 进行 配对 ， 它们 配对 的 几率 是 28%。 启 示 : 在 锦标 赛 中 ， 当 低 筹码 时 ， 只 要 你 获 
得 A， 就 立马 全 押 。 

如 果 你 没 获 得 第 三 张 牌 ， 你 需要 在 翻 牌 时 把 对 子 变 成 三 条 (3 张 一 样 的 牌 )， 并 且 你 只 有 8% 
的 几率 能 获得 三 条 。 启 示 : 不 要 花 太 多 的 钱 等 你 的 低 对 子 牌 变 成 能 使 你 获得 巨大 成 功 的 手 牌 。 

随 着 越 来 越 多 的 牌 被 发 出 , 你 那 翻 牌 前 看 起 来 还 不 错 的 A~K 或 K~Q 如 果 还 没有 配对 或 凑 成 顺 
子 ， 那 它们 的 潜在 优势 会 前 弱 。 如 果 你 在 河 牌 时 并 没有 命中 ，100 次 中 有 87 次 ， 那 个 伟大 的 起 手 
有 牌 仍然 是 为 数 不 多 的 优质 手 牌 。 启示 : 只 有 当 你 可 以 花 少量 代价 地 这 样 做 时 , 保持 你 那 A~K 未 完 
成 的 梦想 。 







































































4.10.2 ”快速 解读 公共 上 牌 
这 里 有 一 些 关 于 你 对 手 手 牌 的 常识 , 这 些 常识 一 定 是 真实 的 ,很 多 人 知道 但 不 一 定 会 说 出 来 : 























一 对 [条 
一 对 满堂 红 
同一 花色 的 3 张 牌 司 花 
5 张 顺 子 牌 中 的 3 张 牌 顺 子 
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你 可 以 通过 学 习 这 些 规则 ,分 析 对 手 可 能 有 的 手 牌 ， 从 而 更 快 做 决策 。 那 么 ， 当 某 些 情况 不 
可 能 时 , 你 可 以 自动 排除 杀手 牌 。 你 也 许 不 必 担 心 速度 , 但 如 果 你 无 需 浪费 精力 每 次 都 从 头 开始 
搞 清楚 这 些 东 西 ， 你 就 可 以 花 时 间 专 注 于 更 重要 的 决定 。 





一 组 人 中 ,至 少 有 两 个 人 是 同一 天 主 日 的 几率 是 多 少 ? 根据 现在 的 人 数 未 看 , 这 个 几 
这 出奇 地 高 。 使 用 简单 的 概 计 规则 ,可 以 在 聚会 上 使 你 的 朋友 对 你 印象 深刻 (也许 还 
能 在 酒吧 打赌 赢得 一 些 钱 )。 


有 些 在 逻辑 上 似乎 不 可 能 的 事件 , 其 实在 某 些 情况 下 完全 有 可 能 。 例如 确定 一 组 人 中 至 少 有 
两 人 的 生日 是 同一 天 的 概率 。 许多 人 震惊 地 得 知 ， 只 要 群 组 的 人 数 不 少 于 23, 那么 至 少 有 两 人 生 
日 相同 的 几率 比 50% 还 高 ! 通过 使 用 一 些 简单 的 概率 规则 ， 你 可 以 算出 任何 规模 的 群 组 中 ， 这 一 
事件 发 生 的 几率 ， 然 后 当 你 的 预言 成 真 时 ， 你 的 朋友 会 吃惊 。 


| I 4.11 让 你 最 亲密 的 23 个 朋友 震惊 
#45 














ww 你 也 可 以 利用 这 个 结果 在 酒吧 下 注 ， 从 而 赚 一 些 钱 ( 只 要 那里 至 少 有 23 个 人 





那么 , 你 如 何 算出 至 少 两 个 人 的 生日 是 同一 天 的 概率 ?为 了 解决 这 个 问题 , 你 需要 对 生日 在 
总 体 中 的 分 布 做 几 个 假设 ,并 知道 计算 概率 的 一 些 规则 方法 。 


4.11.1 入 门 

要 确定 至 少 有 两 个 人 生日 是 同一 天 的 几率 , 我们 必须 对 生日 的 分 布 做 一 些 合理 的 假设 。 首 先 ， 
我 们 假设 生日 在 总 体 中 是 均匀 分 布 的 。 这 意味 着 在 一 年 中 ， 每 一 天 出 生 的 人 数 大 致 相同 。 

这 一 假设 不 一 定 完全 正确 ,但 非常 接近 真实 情况 ,足以 让 我 们 相信 计算 的 结果 。 然 而 ， 这 个 
假设 对 2 月 29 日 这 个 日 期 是 绝对 不 正确 的 , 因为 它 只 在 每 4 年 一 次 的 周年 发 生 。 好 消息 是 ,没有 那 
么 多 的 人 出 生 在 2 月 29 日 ， 所 以 我 们 能 够 在 忽略 它 的 情况 下 仍然 得 到 准确 的 估计。 


一 旦 我 们 做 好 了 这 两 个 假设 ,就 可 以 相对 容易 地 解决 生日 问题 。 








4.11.2 ”运用 全 概率 法 
在 我 们 的 问题 中 ， 只 有 两 种 互 斥 的 可 能 结 


口 至 少 有 两 人 的 生日 是 同一 天 ; 
口 没有 人 的 生日 是 同一 天 。 
由 于 这 两 件 事情 必 有 其 一 发 生 , 所 以 其 概率 之 和 始终 等 于 1。 统计 学 家 把 这 称 作 全 概率 法 则 ， 
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而 且 在 这 个 问题 上 派 上 了 用 场 。 





ww 术语 “ 互 斥 ”意味 着 ， 如 果 一 件 事情 发 生 ， 另 一 件 事情 就 不 会 发 生 ， 反 之 亦 然 。 


一 个 简单 的 抛 硬币 的 例子 可 以 帮助 我 们 理解 它 的 原理 。 抛 一 枚 正常 的 硬币 , 得 到 正面 的 概率 
为 0.5， 得 到 反面 的 概率 也 是 0.5 ( 这 是 互 斥 事件 的 典型 例子 ， 因 为 抛掷 硬币 一 次 不 能 同时 得 到 正 
面 和 反面 ! )。 只 要 抛 出 硬币 ， 两 件 事 情 必 有 其 一 要 发 生 。 它 落地 时 一 定 要 么 正面 朝 上 ， 要 么 反面 
朝 上 ， 所 以 正面 或 反面 发 生 的 概率 是 1 ( 0.5+0.5 )。 进 而 我 们 能 想到 ， 正 面 的 概率 是 1 减 去 反面 
(1-0.5=0.5 ) 的 概率 ， 反 之 亦 然 。 


有 时 候 ， 计 算 一 件 事 件 没 有 发 生 的 概率 很 容易 ， 所 以 可 用 该 信息 来 确定 它 发 生 的 概率 。 所 有 
人 生日 都 不 同 的 概率 比较 容易 弄 清 楚 ， 它 只 取决 于 组 里 有 多 少 人 。 

试想 一 下 ， 我 们 这 个 组 只 有 两 个 人 。 他 们 同一 天 生日 的 概率 是 多 少 ? 咽 ， 他 们 生日 不 是 同 
一 天 的 概率 很 容易 计算 : 第 一 个 人 的 生日 是 某 天 ， 第 二 个 人 的 生日 如 果 在 其 他 的 364 天 中 的 一 
天 , 那么 他 们 的 生日 就 不 是 同一 天 。 所 以 , 在 数学 上 , 概率 是 364 除 以 365( 可 能 的 生日 的 总 数 )， 
或 0.997。 


由 于 两 个 人 生日 不 是 同一 天 的 概率 是 0.997 ( 非常 高 的 概率 )， 实 际 上 他 们 同一 天 生日 的 概率 
等 于 1-0.997〈0.003， 非 常 低 的 概率 )。 这 意味 着 ， 每 1000 对 随机 选 定 的 人 ， 只 有 3 对 的 生日 是 同 
一 天 。 到 目前 为 止 ， 这 从 逻辑 意义 上 来 说 是 完美 的 。 然 而 ， 一 旦 我 们 开始 在 群 里 添加 更 多 的 人 ， 
事情 就 开始 改变 (迅速 改变 )! 



























































4.11.3 ”计算 独立 事件 的 概率 


解决 我 们 的 问题 还 需要 另 一 个 诀窍 , 即 采用 独立 事件 的 概念 。 如 果 两 件 事情 同时 发 生 的 概率 
等 于 它们 各 自 独立 发 后 概率 的 乘积 ， 那 这 两 件 事 被 视 作 独立 事件 。 

我 们 再 一 次 以 典型 的 、 简 单 而 又 易于 理解 的 抛 硬币 为 例 。 如 果 你 抛 两 次 人 硬币， 两 次 都 得 到 下 
面 的 概率 等 于 正面 的 概率 乘 以 正面 的 概率 (0.5 x 0.5=0.25 )， 因 为 抛 一 次 硬币 的 结果 对 其 他 次 抛 
硬币 的 结果 没有 影响 ( 因此 ， 它 们 是 独立 事件 )。 

所 以 ， 当 你 抛 两 次 硬币 ， 有 1/4 的 概率 会 出 现 连续 两 个 正面 。 如 果 你 想 知 道 连 续 抛 出 3 个 正面 
的 概率 ,答案 是 0.125 ( 0.5 x 0.5 x 0.5 )， 这 意味 着 连续 3 个 正面 发 生 的 概率 只 有 1/8。 

在 我 们 的 生日 问题 里 , 每 次 添加 一 个 人 到 组 里 , 就 相当 于 添加 了 一 个 独立 的 事件 ( 因为 一 个 
人 的 生日 不 影响 任何 其 他 人 的 生日 )， 因此， 不管 有 多 少 人 ， 我 们 都 可 以 算出 至 少 两 个 人 同一 天 
生日 的 概率 ， 我 们 只 需 不 断 将 概率 相 乘 即 可 。 
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仿 查 一 下 ,不 管 我 们 的 小 组 有 多 少 人 ， 只 有 两 个 相互 独立 的 事件 发 生 : 至 少 有 两 个 人 生日 是 
同一 天 或 者 没有 任何 两 个 人 生日 相同 。 由 全 概率 法 则 , 我 们 得 知 , 我 们 可 以 计算 没有 任何 两 个 人 
同一 天 生日 的 概率 ， 然 后 用 1 减 去 这 个 概率 就 等 于 至 少 有 两 个 人 生日 相同 的 概率 。 最 后 ， 我 们 也 
知道 ， 每 个 人 的 生日 都 独立 于 组 里 的 其 他 成 员 。 都 明白 了 吗 ? 好 ， 那 我 们 继续 ! 














4.11.4 ”解决 生日 问题 


我 们 已 经 确定 了 两 人 小 组 中 ,两 人 生日 不 是 同一 天 的 概率 等 于 0.997。 假 如 我 们 在 这 个 组 里 
添加 了 另 一 个 人 ， 所 有 人 生日 都 不 同 的 概率 是 多 少 ? 对 于 第 三 个 人 来 说 ， 如 果 生 日 在 其 他 的 363 
天 ,那么 他 们 3 人 的 生日 不 同 。 因 此 ， 第 三 个 人 和 其 他 两 人 生日 不 同 的 概率 是 363/365 ， 或 0.995 
( 略 低 )。 

但 是 , 请 记 住 , 我 们 感 兴趣 的 是 , 所 有 人 生日 都 不 同 的 概率 , 所 以 我 们 使 用 独立 事件 的 法 则 ， 
将 前 两 个 人 生日 不 是 同一 天 的 概率 ， 乘 以 第 三 人 与 这 两 个 人 生日 不 是 同一 天 的 概率 : 0.997 x 
0.995=0.992。 所 以 ,在 这 个 3 人 组 里 ， 所 有 人 生日 都 不 同 的 概率 是 0.992 ， 这 意味 着 至 少 有 两 个 人 
生日 相同 的 概率 是 0.008 ( 1-0.992 )。 


这 意味 着 ， 随 机 选择 出 1000 组 3 人 小 组 ， 只 有 8 组 会 有 至 少 2 人 生日 相同 。 这 仍然 是 一 个 非常 
小 的 几率 ,但 注意 ， 相 比 两 人 小 组 ，3 人 小 组 的 概率 翻番 了 ( 从 0.003 变 成 0.008 )! 

一 旦 我 们 开始 把 越 来 越 多 的 人 添加 到 组 里 ， 至 少 2 人 生日 相同 的 概率 也 随 之 增加 得 非常 快 。 
当 我 们 的 组 员 达 到 10 人 时 ， 至 少 2 人 生日 相同 的 概率 高 达 0.117。 我 们 应 该 如 何 确定 这 个 值 呢 ? 对 
每 个 添加 到 该 组 的 人 ， 将 他 带 来 的 额外 分 数 和 以 往 的 分 数 相 乘 。 每 个 额外 分 数 都 以 365 为 分 母 ， 
分 子 是 365 减 去 添加 这 个 人 之 前 小 组 的 人 数 。 

因此 ， 对 于 我 们 前 面 提 到 的 10 人 小 组 ， 最 后 分 数 的 分 子 是 3$6 ( 365-9 )， 概 率 计 算 如 下 : 


364 363 362 361 360 359 358 357 356 
x x x x x x x x = 0.883 
365 365 365 365 365 365 365 365 365 


这 告诉 我 们 ， 在 10 人 小 组 中 ， 所 有 人 生日 都 不 同 的 概率 等 于 0.883 ( 比 2 人 或 3 人 小 组 的 概率 
要 低 得 多 )， 所 以 至 少 2 人 生日 相同 的 概率 是 0.117 ( 1-0.883 )。 

第 一 个 分 数 是 第 二 人 和 第 一 个 人 生日 不 同 的 概率 。 第 二 个 分 数 是 第 三 人 和 前 两 个 人 生日 不 同 
的 概率 。 第 三 个 分 数 是 第 四 个 人 和 前 3 个 人 生日 不 同 的 概率 ， 以 此 类 推 。 第 九 个 也 是 最 后 一 个 分 
数 是 第 十 个 人 和 任何 其 他 9 个 人 生日 不 同 的 概率 。 







































































所 有 人 生日 都 不 同意 味 着 , 一 连 囊 事 件 中 的 每 一 个 事件 都 必须 共同 出 现 ， 所 以 我 们 
通过 将 所 有 单个 概率 相 乘 来 计算 同一 组 所 有 事件 发 生 的 概率 。 每 当 我 们 添加 一 个 
人 ， 我 们 就 有 一 个 分 数 进 入 方程 ， 这 使 得 最 终 乘 积 越 来 越 小 。 


J 
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4.11.5 任意 规模 小 组 的 解决 方案 

随 着 小 组 规模 的 增加 , 至 少 2 人 生日 相同 这 一 事件 变 得 越 来 越 有 可 能 。 这 是 非常 合情合理 的 ， 
但 随 着 小 组 规模 变 大 ,至 少 2 人 生日 相同 的 概率 迅速 变 大 的 程度 令 大 多 数 人 震惊 。 图 4-3 说 明 当 你 
添加 越 来 越 多 的 人 时 ， 概 率 上 升 的 速率 。 








随 着 小 组 人 数 的 增加 ， 无 人 生日 相同 的 概率 递减 









随 着 小 组 人 数 的 增加 ， 
至 少 2 人 生日 相同 的 概率 递增 


0.257 

















图 4-3: 生日 相同 的 概率 


对 于 20 人 来 说 ， 概 率 为 0.411; 30 人 的 概率 是 0.706 ( 即 10 次 中 有 7 次 ， 你 会 在 你 的 赌注 上 赢 钱 ， 

这 是 相当 不 错 的 几率 ) 如 果 你 组 里 有 23 人 , 至 少 2 人 生日 相同 的 概率 ( 0.507 ) 只 是 比 0.5 稍 微 高 一 点 。 

不 管 怎么 说 , 这 是 一 个 非常 巧妙 的 方法 ， 人 们 从 未 停止 过 对 它 的 惊叹 。 但 要 记 住 , 只 有 当 房 

间 里 至 少 有 23 人 时 (并且 你 愿意 接受 50/50 的 赔 率 )， 你 才 可 以 下 注 。 人 越 多 ， 它 越 有 效 ， 因 为 每 

添加 一 个 人 ,你 获胜 的 几率 就 会 显著 上 升 。 为 了 有 90% 的 几率 让 你 赢得 赌注 ， 你 需要 保证 房间 里 

有 41 人 至少 2 人 同一 天 生日 的 概率 等 于 0.903 )。 如 果 房 间 里 有 50 人 ， 你 会 有 97% 的 几率 赢得 钱 。 

一 旦 人 数 超过 60， 实 际 上 你 能 保证 房间 里 至 少 有 2 人 生日 相同 ， 当 然 ， 如 果 有 366 人 出 席 ， 至 少 2 
人 生日 相同 的 几率 是 100%。 如 果 你 能 让 别人 和 你 打赌 ， 这 些 都 是 很 好 的 选择 ! 

一 一 威廉 . 斯 科 朗 普 斯 基 
















































































通过 一 些 计算 ,其 许 利用 一 些 电子 表格 软件 ,你 可 以 计算 出 各 种 各 样 “ 自 发 ”友好 财 
注 的 概率 。 


TD 4.12 设计 你 自己 的 酒吧 赌局 
| 辆 


本 章 其 他 几 个 统计 Hack 使 用 了 纸牌 [Hack #42] 或 骨 子 [Hack #43] 作 为 道具 ,用 来 论证 一 些 看 似 
罕见 和 不 寻常 的 结果 实际 上 却 是 相当 普遍 的 。 作 为 对 教育 领域 的 统计 原则 感 兴趣 的 一 分 子 , 毫 无 
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疑问 你 希望 使 用 这 些 教学 实例 来 打动 和 指导 他 人 。 当 然 ， 如 果 你 碰巧 在 此 过 程 中 赢 了 一 点 钱 ,， 也 
可 视 作 教师 生涯 的 好 处 之 一 。 

但 你 没有 必要 完全 依赖 这 里 提供 的 具体 例子 ， 甚 至 随身 携带 纸牌 盘子 ( 虽然， 推 已 及 人 ， 
你 可 能 有 很 多 其 他 的 原因 随身 之 着 纸牌 和 骨 子 )。 这 里 有 几 个 基本 的 原则 ， 你 可 以 用 这 些 原则 对 
任何 已 知 的 数据 分 布 制作 自己 的 赌局 ， 诸 如 字母 、1~100 的 数字 ， 等 等 。 





























e@ 原则 1 
一 个 不 太 可 能 的 事件 ， 如 果 有 它 有 重复 出 现 的 机 会 ， 那 么 它 出 现 的 可 能 性 会 增加 。 
e@ 原则 2 


如 果 有 大 量 的 可 能 事件 ， 那 么 发 生 任何 特定 事件 的 几率 都 很 小 。 
接 下 来 ， 本 Hack 会 告诉 你 如 何在 自己 的 酒吧 赌局 里 将 这 些 原则 转变 为 自身 优势 。 








4.12.1 原则 1 


任何 给 定 事件 发 生 的 概率 取决 于 匹配 结果 数 ， 等 于 匹配 结果 数 除 以 可 能 的 结果 数 。 例 如 , 你 
和 我 在 同一 月 份 出 生 的 概率 是 多 少 ? 迅速 反应 : 出 生 月 份 平均 分 布 在 所 有 月 份 ， 概 率 为 12。 只 
有 一 个 结果 算 作 是 匹配 ( 你 的 出 生 月 份 ), 一 共有 12 个 可 能 的 结果 (一 年 有 12 个 月 )。 


任何 2 个 读 这 本 书 的 人 中 ， 有 人 和 我 在 同一 月 份 出 生 的 概率 是 多 少 ? 赁 直觉 应 该 大 于 1/12。 
很 遗憾 , 这 个 概率 的 计算 公式 并 不 简单 。 比 如 , 它 本 身 不 是 1/12。 这 将 产生 一 个 比 我 们 开始 时 ( 即 
1/24 ) 更 小 的 概率 。 也 不 是 公式 I/12+1/12， 昌 然 2/12 似 乎 有 和 希望 是 正确 答案 ， 因 为 它 大 于 1/12， 
意味 着 比 之 前 有 更 大 的 可 能 性 , 但 这 种 概率 并 不 都 是 加 法 。 为 了 证 明 简 单 地 把 两 个 分 数 相 加 是 无 
效 的， 我 们 假设 这 个 问题 里 有 12 个 人 。 在 12 个 人 里 找到 一 个 和 我 出 生 月 份 匹配 的 几率 显然 不 是 
12/12， 因 为 这 意味 着 肯定 会 有 一 个 匹配 。 

一 个 事件 在 多 次 机 会 中 出 现 的 可 能 性 的 计算 公式 基于 这 样 一 个 概念 : 每 增加 一 次 尝试 ( 如 骨 
子 投掷 )， 就 多 乘 一 次 此 事件 不 会 发 生 的 概率 。 这 一 过 程 结束 后 , 用 1 减 去 这 个 结果 ,会 得 到 该 事 
件 发 生 的 概率 。 

这 个 公式 有 理论 上 的 吸引 力 ， 因 为 它 逻 辑 上 等 同 于 更 直观 的 方法 ( 它 使 用 相同 的 信息 )。 它 
也 具有 数学 上 的 吸引 力 , 因为 最 终结 果 大 于 单一 事件 发 生 的 概率 , 与 我 们 的 直觉 相符 。 这样 思考 : 
有 多 少 次 它 不 会 发 生 ， 而 这 些 次 中 ， 有 多 少 在 下 一 次 还 不 会 发 生 ? 

下 面 是 计算 2 个 读者 中 ， 有 人 和 我 同一 月 份 出 生 的 概率 公式 : 

































































局 滞 =1-(0.917X0.917)=1-0.841= 0.159 
12 12 
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4.12.2 ”原则 2 





为 了 让 别人 接受 你 的 赌注 或 用 任何 特定 的 结果 让 观众 惊讶 , 从 直觉 上 这 个 事件 的 可 能 性 必须 
要 小 。 所 以 ,赌注 或 魔术 可 以 与 一 年 365 天 或 一 副 扑 克 的 52 张 牌 有 关 ， 一 本 电话 憩 里 所 有 可 能 的 
电话 号 码 更 有 效 、 更 惊人 ， 因 为 和 获胜 结果 数量 ( 比如 1 ) 相 比 ， 这 些 数字 看 起 来 如 此 之 大 。 

任何 小 概率 事件 在 单一 试验 中 发 生 的 几率 确实 很 小 ， 所 以 这 一 原则 中 表达 的 直觉 是 正确 的 。 
但 是 ,正如 我 们 所 看 到 的 ， 如 果 进 行 多 于 一 次 的 试验 , 该 事件 发 生 的 几率 会 增加 ,并 且 可 以 迅速 
增加 。 





























4.12.3 ”启动 你 的 酒吧 赌注 
让 我 们 遍历 我 刚 制作 的 几 个 财 局 ， 来 证 实 我 的 优势 。 
1. 字母 表 中 的 字母 
在 这 个 赌 中 , 我 会 从 字母 表 里 选 5 个 字母 。 我 敢 打赌, 如 果 我 选择 6 人 ， 并 要 求 他 们 随机 挑选 


任何 一 个 字母 ， 他 们 挑选 的 字母 中 有 一 个 或 多 个 会 和 我 的 $ 个 字母 里 的 字母 相 匹 配 。 以 下 是 投注 
展开 方式 。 


@ 可 能 的 选择 数 

字母 表 中 有 26 个 字母 。 

@ 单 次 尝试 失败 的 概率 

26 个 可 能 中 有 21 个 是 不 匹配 的 : 21/26=0.808。 


。 尝试 次 数 








6 次 

@ 6 次 尝试 均 失 败 的 概率 

0.8085=0.278 

@ 6 次 尝试 不 均 失 败 的 概率 

1-0.278=0.722 

我 赢得 这 个 赌注 的 概率 是 72%。 

2. 选择 一 个 任意 号 码 

这 一 次 ， 我 从 数字 1~100 中 选 出 10 个 数字 。 我 敢 打赌 ， 如 果 我 选择 10 人 ， 并 让 他 们 随意 从 数 
字 1~100 挑 选 一 个 ， 他 们 挑选 的 数字 中 有 一 个 或 多 个 会 和 我 的 10 个 数字 里 的 数字 相 匹 配 。 以 下 是 
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计算 过 程 。 
@ 可 能 的 选择 数量 
有 100 个 号 码 可 供 选 择 。 





@ 单 次 尝试 失败 的 概率 

100 个 可 能 有 90 个 是 不 匹配 的 : 90/100=0.90。 
@ 尝试 次 数 

10 次 

@ 10 次 尝试 均 失 败 的 概率 

0.91"=0.349 

@ 10 次 尝试 不 均 失 败 的 概率 

1-0.349=0.651 

我 赢得 这 个 赌注 的 概率 是 65%。 

3. 亲自 实践 


重复 我 刚刚 展示 给 你 的 步骤 和 计算 ,开发 自己 的 原创 聚会 技巧 。 所 有 这 些 都 不 需要 任何 道具 ， 
只 需要 一 个 有 意愿 且 诚 实 的 志愿 者 。 


请 注意 ,该 计算 基于 人 们 随机 挑选 号 码 这 一 情况 。 当 然 ， 实际 上 ， 人 们 往往 不 会 挑 一 个 他 们 刚 Ee 
刚 听 到 别人 挑 过 的 字母 或 数字 。 换 句 话 说， 他 们 的 选择 不 独立 于 其 他 人 的 选择 。 如 果 当 前 的 选择 是 
基于 之 前 的 不 正确 选择 (或 不 应 选 ) 而 作出 的 ,这 将 有 助 于 提高 你 的 胜算 。 例 如 , 在 100 选 10 的 数字 
赌 中 ， 如 果 10 人 中 有 人 会 选择 别人 选 过 的 数字 的 可 能 性 为 0， 那 你 获胜 的 几率 将 从 65% 上 升 到 67%。 






































4.12.4 ”确保 被 骗 的 不 是 你 


和 别人 玩 是 有 趣 的 , 但 你 永远 不 知道 什么 时 候 会 落 入 别人 设计 的 聪明 统计 陷阱 里 。 例如, 还 
记得 你 和 我 有 相同 的 出 生 月 份 ， 从 12 个 月 里 选 1 个 月 这 样 的 几率 吗 ? 我 骗 了 你 ! 我 出 生 在 2 月 。 那 
个 月 比 其 他 月 份 的 天 数 要 少 ， 所 以 你 出 生 在 2 月 的 几率 实际 上 小 于 1/12。2 月 有 28.25 天 (偶尔 出 现 
的 2 月 29 日 计 作 0.25 ), 并 且 当 年 是 365.25 天 ( 偶尔 出 现 的 头 年 同样 计数 )。 你 和 我 出 生 在 同一 月 份 
的 几率 是 28.25/365.25 ( 7.73% )， 而 不 是 8.33% ( 1/12 )。 

所 以 ， 你 不 太 可 能 和 我 有 相同 的 出 生 月 份 。 我 想起 来 了 , 我 的 出 生 记 录 、 出 生 证 明 等 资料 在 
很 多 年 前 的 一 场 大 火 中 不 见 了 。 所 以 ， 现 在 我 出 生 的 原始 数据 遗失 了 。 

说 不 定 ， 我 可 能 甚至 没 出 生 呢 ! 
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1 隔 4.13 ”疯狂 地 玩 百 搭 牌 
也 1 人 在 提 夺 游戏 中 加 入 百 搓 牌 ， 可 以 提高 玩 牌 的 东 趣 。 但是， 从 统计 上 来 说 ， 百 操 牌 也 使 
得 事情 灾 得 混乱 了 。 





几 百 年 前 , 扑克 玩家 制定 了 手 牌 的 排名 顺序 , 并 决定 什么 牌 可 以 战胜 什么 牌 。 令 人 高 兴 的 是 ， 
从 统计 角度 来 说 , 他 们 制定 的 顺序 和 玩家 发 到 的 手 牌 概率 是 一 个 完美 的 匹配 。 据 推测 ,扑克 规则 
的 开发 者 要 么 做 了 计算 , 要 么 引用 了 他 们 自己 在 实际 玩 牌 中 看 到 的 每 种 手 牌 出 现 的 频率 。 也 可 能 
是 他 们 拿 一 副 牌 、 纸 和 铅笔 ， 在 一 个 轻松 的 下 午 ， 自 己 随机 发 了 成 千 上 万 次 的 扑克 手 牌 ， 然 后 收 
集 数据 。 不 管用 了 什么 方法 ， 手 牌 大 小 的 排序 和 特定 组 合 牌 的 相对 稀缺 性 是 一 个 完美 的 匹配 。 

不 过 , 排名 顺序 并 没有 考虑 到 某 种 类 型 的 手 牌 和 排名 紧 随 其 后 的 手 牌 类 型 之 间 意 义 重大 的 概 


率 差 距 。 例 如 ， 同 花 顺 不 出 现 的 概率 是 排 紧 其 后 的 四 条 的 16 倍 ， 同 时 ， 顺 子 紧 排 在 同 花 之 后 ， 而 
同 花 的 出 现 概 率 只 有 顺 子 的 一 半 。 


在 我 们 谈论 玩 百 搭 牌 ( 指 可 蔡 换 持 牌 者 任意 想 要 值 的 牌 , 通常 是 王牌 ) 的 问题 之 前 ， 让 我 们 
回顾 一 下 扑克 手 牌 的 大 小 排序 。 表 4-17 所 示 的 是 在 任意 随机 的 5 张 牌 里 ， 出 现 一 副 给 定 手 牌 的 概 
率 ; 与 排序 紧 随 其 后 的 手 牌 相 比 ， 每 个 手 牌 的 相对 稀少 性 也 显示 在 下 表 中 。 





















































表 4-17: 扑克 手 牌 、 概 率 及 对 比 


























手 牌 概率 相对 稀少 性 
同花顺 0.000 015 16 倍 的 不 太 可 能 
四 条 0.000 24 5.8 倍 的 不 太 可 能 
满堂 红 0.001 4 1.4 倍 的 不 太 可 能 
癌 花 0.0019 2.1 倍 的 不 太 可 能 
顺 子 0.003 9 4.4 倍 的 不 太 可 能 
三 条 0.021 2.3 倍 的 不 太 可 能 
两 对 0.048 8.8 倍 的 不 太 可 能 
一 对 0.42 1.2 倍 的 不 太 可 能 
什么 都 不 是 0.50 








对 于 赌 徒 来 说 ， 表 4-17 还 有 若干 值得 注意 的 观察 结果 。 首 先 ，5 张 牌 的 赌博 中 ， 有 一 半 的 时 
间 玩 家 什么 好 牌 都 没有 。 几 乎 一 半 的 时 间 ， 玩 家 有 一 个 对 子 。 玩 家 只 有 8% 的 时 间 获 得 比 一 对 更 
好 的 手 牌 。 

其 次 ,一 些 出 现 可 能 性 看 似 完全 不 同 的 手 牌 ， 出 现 的 概率 却 几 乎 相同 。 注 意 ， 同 花 和 满堂 红 
出 现 的 概率 大 致 相同 。 


最 后 ,三 条 之 后 ， 出 现 更 好 手 牌 的 可 能 性 迅速 下 降 。 事实 上 , 在 概率 上 出 现 了 两 个 巨大 的 下 
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跌 : 大 多 数 时 候 ( 92% ) 什么 都 没有 或 有 一 个 对 子 ,然后 两 对 或 三 条 发 生 的 概率 是 另外 的 7%， 只 
有 不 到 1% 的 时 间 能 看 到 比 三 条 好 的 手 牌 。 





4.13.1 百 搭 牌 的 问题 


上 面 的 结果 非常 有 趣 , 但 这 到 底 和 百 搭 牌 的 使 用 有 什么 关系 ?好 吧 , 在 一 副 牌 里 加 入 百 搭 牌 
把 所 有 这 些 经 过 时 间 考 验 的 概率 都 搞 砸 了 。 假设 一 名 百 搭 牌 持 有 人 和 希望 凑 成 最 好 的 手 牌 ,， 并 且 还 
假定 已 被 把 百 搭 牌 添加 到 一 副 牌 里 了 ， 表 4-18 显 示 了 相 比 于 传统 概率 的 新 概率 。 


表 4-18: 一 副 牌 里 有 一 张 百 搭 牌 时 下 列 手 牌 出 现 的 概率 























手 牌 。 百 措 牌 存在 时 的 概率 ” 经 典 概率 。” 百 拱 牌 导致 的 概率 改变 
当 条 0.0000045 rr 
同花顺 0.000 064 0.000 015 增加 327% 
四 条 0.001 1 0.000 24 曾 加 358% 
满堂 红 0.002 3 0.001 4 增加 64% 
同 花 0.002 7 0.0019 增加 42% 
顺 子 0.0072 0.003 9 兽 加 85% 
三 条 0.048 0.021 增加 129% 
两 对 0.043 0.048 减少 10% 
一 对 0.44 0.42 曾 加 5% 
什么 都 不 是 0.45 0.50 减少 10% 




















通过 新 概率 , 我 们 可 以 发 现 百 搭 牌 的 问题 很 明显 , 尤其 是 当 我 们 看 三 条 和 两 对 时 。 有 了 百 搭 
牌 后 ， 三 条 比 两 对 更 常见 ! 

传统 上 定好 的 手 牌 大 小 的 排名 顺序 不 再 与 实际 概率 相符 。 此 外 ， 当 增加 了 一 张 百 搭 牌 后 ， 获 
得 两 对 的 几率 实际 上 下 降 了 。 当然 , 其 他 概率 也 发 生 了 变化 , 其 他 所 有 可 玩 的 手 牌 变 得 更 有 可 能 。 
一 些 超级 手 牌 , 虽然 依然 罕见 , 但 概率 被 极 大 地 提高 了 : 三 条 好 的 手 牌 出 现 的 概率 是 之 前 出 现 概 
率 的 两 倍 左右 。 

知道 这 些 新 概率 给 精明 的 扑克 玩家 带 来 优势 。 经 验 丰富 的 专业 扑克 玩家 认为 百 搭 牌 是 幼稚 
的 ， 是 给 业余 玩家 玩 的 ， 所 以 他 们 避免 游戏 时 有 百 搭 牌 。 事 实 上 ， 和 这 种 刻板 印象 相反 ,一些 知 
情 玩家 会 物色 这 些 游 戏 ， 因 为 他 们 相信 自己 比 你 这 种 幼稚 类 型 的 人 更 有 优势 。( 你 懂 的 ， 那 些 幼 
稚 类 型 的 人 ， 像 是 不 读 Hacks 系 列 丛书 的 那些 人 ?7 ) 









































4.13.2 ”生效 原理 
正如 你 在 表 4-18 看 到 的 ， 使 用 百 搭 牌 降低 了 获得 两 对 的 概率 。 但 为 什么 会 这 样 呢 ? 无 疑 ， 增 
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加 一 张 百 搭 牌 意味 着 有 时 我 可 以 把 一 对 手 牌 变 成 两 对 手 牌 。 这 是 真 的 , 但 为 什么 可 以 呢 ? 想象 一 
下 ,一 个 玩家 手 里 有 一 对 ,他 的 第 五 张 牌 拿 到 了 一 张 百 搭 牌 。 是 的 ， 他 可 以 将 那 张 百 搭 牌 和 一 张 
单 牌 配 成 一 对 ， 声 明 有 两 对 。 另 一 方面 , 将 这 张 百 搭 牌 和 他 已 有 的 一 对 进行 匹配 能 得 到 三 条 ,这 
是 更 聪明 的 做 法 。 在 考虑 选择 两 对 还 是 选择 三 条 时 ， 大 家 都 会 选 更 历 害 的 三 条 。 























4.13.3 百 搭 牌 的 其 他 问题 


百 搭 牌 的 存在 ,创造 了 让 博弈 理论 家 疯狂 的 一 个 悖 论 。 悖 论 的 原理 如 下 。 


(1) 手 牌 的 排名 和 它们 在 扑克 游戏 中 的 相对 价值 应 该 基于 其 出 现 的 频率 。 较 少 出 现 的 手 牌 应 
该 比较 常见 的 手 牌 具有 更 多 的 价值 。 

(2) 在 选择 是 否 使 用 百 搭 牌 把 手 牌 变 成 两 对 或 三 条 的 情况 下 ， 玩 家 通常 会 选择 组 成 三 条 。 这 
实际 上 改变 了 频率 ， 使 得 两 对 变 得 比 三 条 更 少见 。 

(3) 因为 排名 应 根据 概率 制定 ， 所 以 当 有 百 搭 牌 参与 时 ， 应 该 将 扑克 规则 变 成 两 对 ， 这 上 比 三 
条 更 有 价值 。 

(4) 采用 修订 后 的 排名 ， 三 条 的 价值 不 如 两 对 的 价值 ， 所 以 现在 聪明 的 玩家 会 用 他 们 的 百 拱 
牌 次 成 两 对 以 代替 三 条 ， 所 以 很 快 两 对 就 会 变 得 比 三 条 更 加 常见 。 

(5) 排名 规则 将 不 得 不 再 次 改变 以 匹配 因为 之 前 规则 变动 所 导致 的 实际 频率 ， 永 无 止境 的 循 
环 将 就 此 开始 。 

表 4-18 假 设 玩 家 会 根据 传统 排名 来 组 成 他 们 最 好 的 手 牌 , 这 样 就 避免 了 这 一 悖 论 。 我 很 聪明 ， 
是 吧 ? 想 玩 牌 吗 ? 























在 通常 过 俗 统 计 的 志 界 里 ， 所 有 的 神圣 事物 中 ， 没 有 什么 比 谈 转 一 杖 诚实 的 硬币 更 可 
信 了 。 无 论 是 正面 还 是 反面 ,几率 都 是 50% ,对 不 对 ? 显然 仿 人 不 安 约 答案 是 :不 是 50%1 


I 下 4.14 永远 不 要 相信 一 枚 诚实 的 硬币 
#48 








对 几率 以 及 运作 原理 的 基本 人 解释， 几乎 总 是 包含 一 个 简单 的 抛 硬 币 或 旋转 硬币 的 例子 。“ 正 
面 你 说 ; 反面 我 启 。 是 解决 各 种 纠纷 的 通常 方法 ,二 项 分 布 [Hack#66] 通 常 作为 随机 硬币 结果 的 
样式 来 描述 和 讲授 。 

但 事实 证 明 , 如 果 你 旋转 硬币 ,尤其 是 一 枚 全 新 的 硬币 ,反面 朝 上 的 次 数 可 能 比 正面 朝 上 的 





























4.14.1 ”闪耀 的 新 便士 
你 知道 一 枚 全 新 的 一 分 钱 的 外 观 和 感觉 对 吧 ? 它 是 如 此 明亮 ,以 至 于 看 起 来 很 假 。 它 的 细 
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节 是 如 此 丰富 ， 它 的 边缘 是 如 此 锋利 ， 因 此 你 要 小 心 ， 不 要 制 伤 自己 。 

好 了 ， 给 自己 准备 一 枚 明亮 、 尖 锐 的 小 硬币 ， 将 它 旋 转 100 次 左右 。 收 集 正 面 和 反面 的 结 
数据 ,准备 震惊 吧 ， 因 为 出 现 反 面 的 次 数 很 可 能 会 超过 50 次 。 如 果 我 们 对 硬币 公平 性 的 理解 是 正 
确 的 , 那么 一 枚 硬币 出 现 反 面 的 几率 是 一 半 。( 大 声 说 最 后 一 句 ， 这 样 它 更 有 意义 。) 但 是 , 新 便 
士 不 是 这 样 的 。 

新 硬币 ,至少 新 便士 , 往往 有 一 个 清晰 的 边缘 ,实际 上 在 反面 有 点 长 或 有 点 高 (便士 的 反面 
比 正面 刻 的 要 深 一 点 ) 图 4-4 给 出 了 边缘 看 起 来 如 何 的 概念 。 如 果 旋 转 这 样 一 个 形状 物体 ， 朝 上 
的 面 往往 会 是 长 边 。 




































































































































































图 4-4: 旋转 新 便士 

想象 一 下 ,旋转 一 个 从 啤酒 或 苏打 汽水 上 取 下 的 瓶 盖 。 它 不 但 不 会 转 得 这 么 好 ， 而 且 你 也 不 
会 因为 看 到 它 锋 利 面 朝 上 而 感到 惊讶 。 新 便士 的 形状 有 点 像 一 个 瓶 盖 ， 只 是 没有 那么 不 对 称 。 不 
过 ， 就 赁 这 点 小 小 的 锋利 ， 如 果 旋 转 很 多 次 ， 反 面 的 优势 就 会 体现 出 来 。 











4.14.2 ”二 项 式 期 望 

可 能 存在 的 瓶 盖 效应 提出 了 一 个 可 检验 的 假说 : 

旋转 一 个 刚 铸造 的 便士 ， 反 面 朝 上 的 概率 大 于 5$0%。 

当然 ， 几 次 旋转 后 ,我 们 可 能 发 现 一 枚 硬币 反面 朝 上 的 次 数 多 于 正面 ,或许 这 只 是 偶然 , 不 
能 真 的 证 明 什么 。 我 们 知道 ， 在 小 样本 中 出 现 某 结 果 的 概率 不 代表 样本 抽取 总 体 的 属性 。 

我 们 旋转 硬币 的 例子 应 该 代表 无 限 次 的 硬币 旋转 。 如 果 我 们 旋转 硬币 100 次 ， 发 现 $1 次 是 反 
面 朝 上 ， 对 我 们 的 假设 来 说 ， 这 是 可 以 接受 的 证 据 吗 ? 也许 不 是 ; 也 无 法 解释 0.50 的 比例 。52 次 
反面 呢 ? 一 百 万 次 旋转 有 52% 的 反面 呢 ? 
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统计 学 再 次 来 援救 ,并 为 我 们 的 实验 成 果 提供 一 个 判断 标准 。 我 们 从 二 项 式 分 布 知 道 , 理论 
上 一 枚 公平 的 硬币 ( 没有 不 平衡 的 古怪 的 边 ) 在 100 次 旋转 中 ，42% 的 时 间 产 生 51 次 或 更 多 的 反 


面 。 守 旧 派 统计 程序 要 求 一 个 结果 必须 有 5% 或 更 低 的 出 现 几 率 ， 才 被 视 为 统计 显著 


能 是 偶然 发 生 的 。 


这 一 结果 的 显著 怕 














不 太 可 


因此 ,我 们 可 能 不 会 把 100 次 旋转 后 ，51% 的 反面 出 现 作 为 对 我 们 假设 的 支持 。 
另 一 方面 , 如 果 我 们 不 断 地 旋转 硬币 6774 次 , 得 到 了 51% 的 反面 , 那 随机 发 生 的 概率 只 有 5%。 








水 平 为 0.05。 表 4-19 显 示 当 预期 的 结果 是 反面 的 可 能 必 





E 为 50% 时 ， 偶 然 获得 某 


个 比例 反面 的 可 能 性 。 如 果 与 这 个 预计 比例 的 偏差 有 统计 学 意义 , 那么 可 以 将 它们 视 为 支持 我 们 


假说 的 证 据 。 


表 4-19: 硬币 旋转 和 某 个 结果 的 概率 
旋转 次 数 反面 比例 给 定 比 例 或 更 高 的 概率 





100 0.51 
100 0.55 
100 0.58 
500 0.51 
500 0.55 
500 0.58 
1000 0.51 
1000 0.55 
1000 0.58 


1000 次 ， 只 需要 预期 的 


比例 等 于 或 高 于 0. 


0.42 

0.16 

0.05 

0.33 

0.01 

0.000 2 
0.26 

0.001 

0.000 000 2 








58， 这 样 才能 证 明 新 铸 的 便士 确实 有 反面 优势 。 


青 注意 ， 这 种 分 析 能 力 真 的 会 随 着 样本 容量 变 大 而 增加 [Hack #8]。 如 果 你 旋转 硬币 500 次 或 
小 幅 波 动 ， 就 可 以 支持 你 的 假设 。 而 对 于 100 次 旋转 ， 你 需要 看 到 反面 的 


观测 比例 和 预期 比例 的 距离 表示 为 z 分 数 [Hack #26]。 下面 是 计算 z 分 数 和 生成 表 4-19 中 数据 的 


公式 : 


观测 比例 -期 望 比例 
期 望 比例 (1 期 望 比例 ) 
样本 大 小 











分 配 的 概率 是 正 态 曲 线 下 的 区 域 ， 仍 然 高 于 z 分 数 。 


4.14.3 无效 领域 
一 旦 你 向 自己 证 明 , 反面 优势 是 真实 的 , 那 在 你 跑 去 赢得 各 种 疯狂 的 赌注 之 前 听 一 下 我 的 提 





醒 。 你 必须 旋转 硬币 ! 不 要 弹 它 。 跟 我 说 : 旋转 ， 请 不 要 用 手指 弹 。 
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4.14.4 “参阅 


一 个 有 趣 的 网 站 提出 “ 瓶 盖 效应 ”( bottle-cap effect ) 这 一 术语 , 并 包含 了 对 硬币 反面 高 出 的 边 
缘 的 热烈 讨论 。 该 网 站 由 加 里 ， 莱 姆 硕 〈GaryRamseyer ) 博士 维护 ;http://www.ilstu.edu/~gcramsey/。 


TO 4.15 知道 你 的 极限 
#49 人 并 不 总 是 能 作出 理性 的 决定 。 当 预期 回报 巨大 、 赔 衬 也 公平 的 时 候 ， 即 使 是 阿 明 
的 赌 焦 ， 有 时 也 会 拒绝 下 注 。 圣 彼得 堡 屠 论 (St. Petersburg Paradox ) 给 出 了 一 个 相 


当 公 平 的 赌博 游戏 示例 ， 完 全 正常 的 统计 学 家 很 可 能 不 玩 这 个 游戏 ， 只 是 因为 他 们 
是 人 。 


对 于 精明 的 统计 赌 徒 , 标准 的 决策 过 程 涉 及 以 下 步 又 :计算 一 个 假设 赌注 的 平均 回报 和 成 本 ， 


然后 确定 是 否 可 能 收 支 平衡 , 能 赚 到 很 多 钱 则 更 好 。 虽然 一 个 人 能 生成 几 十 个 关于 是 否 应 该 玩 游 
戏 的 统计 分 析 ， 但 人 类 的 心理 感觉 有 时 会 占据 主导 ， 人 们 会 拒绝 接受 赌注 ， 只 是 因为 感觉 不 对 。 
































4.15.1 圣彼得堡 游戏 


圣彼得堡 游戏 大 概 有 300 年 的 历史 。1738 年 ， 丹 尼 尔 ， 伯 努 利 描述 了 游戏 的 参数 。 下 面 是 一 
些 规则 。 

(1) 你 提前 支付 一 定 的 费用 给 我 。 

(2) 抛 硬币 。 如 果 正 面 朝 上 ， 你 赢 了 ， 我 会 付 给 你 2 美元 。 

(3) 如 果 不 是 正面 朝 上 ， 我 们 会 再 次 抛 硬币 。 如 果 这 次 正面 出 现 ， 我 会 付 给 你 2*( 4 美元 )。 

(4) 假如 正面 依然 没有 出 现 ， 我们 再 次 抛 硬币 。 第 三 次 抛 硬 币 正 面 出 现 了 ， 那 我 付 你 2 (8 
美元 )。 

到 目前 为 止 ， 这 听 起 来 很 不 错 ， 对 你 来 说 更 为 公平 。 但 它 会 变 得 更 好 。 我 们 不 断 抛 硬币 ， 直 
到 正面 出 现 。 当 正面 最 终 出 现时 ， 我 付 给 你 2" 美 元 ， 其 中 n 是 出 现 正面 需 抛 硬币 的 次 数 。 

至 少 从 你 的 角度 来 看 ,这 是 个 伟大 的 游戏 。 但 这 里 有 个 要 命 的 问题 : 你 会 为 这 个 游戏 支付 多 
少 钱 ? 
































圣彼得堡 游戏 以 前 可 能 并 没有 作为 受 欢迎 的 赌博 游戏 在 俄罗斯 的 大 街 小 巷 流 行 ,但 

肛 当 赌 钱 时 ， 它 就 一 直 被 用 作 思 维 如 何 处 理 概率 的 假设 示例 。 它 为 早期 统计 学 家 分 析 
“预期 结果 ”在 我 们 头脑 中 的 运转 原理 ， 找 到 了 理由 。 顺 便 说 一 下 ， 关 于 这 一 内 容 
的 论文 实际 上 是 由 圣彼得堡 科学 院 发 表 的 ， 因 而 得 名 。 


决定 你 会 出 多 少 来 玩 游戏 是 个 有 趣 的 过 程 。 作 为 聪明 的 统计 学 家 ， 你 当然 会 支付 不 到 2 美元 
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的 费用 。 即 便 没有 得 到 更 大 回报 的 可 能 性 ， 赌 你 会 在 第 一 次 抛 硬币 时 得 到 正面 , 也 可 以 得 到 多 于 
游戏 投入 的 回报 ， 这 显然 是 一 个 不 错 的 赌注 ， 尝 试 一 下 吧 。 

您 也 可 能 会 乐意 支付 2 美元 。 你 将 有 一 半 的 时 间 赢 回 这 2 美元 , 而 男 一 半 的 时 间 你 会 得 到 比 这 
更 多 ! 这 是 一 个 可 以 保证 你 最 终 获 胜 的 游戏 ， 所 以 获胜 不 是 问题 。 当 你 第 一 次 没有 得 到 正面 时 ， 
你 已 经 保证 自己 至 少 会 赢 4 美元 ， 甚 至 更 多 。 

所 以 , 也 许 你 会 支付 4 美元 来 玩 这 个 游戏 。 当然 , 你 的 回报 偶尔 会 非常 大 一 一 8 美元 、16 美 元 、 
32 美 元 、64 美 元 …… 理 论 上 ， 回 报 可 能 接近 无 穷 大 。 但 是 你 会 支付 多 少 ? 这 就 是 64 美 元 的 问题 。 























4.15.2 ”统计 分 析 
一 些 社 会 科学 研究 人 员 认 为 ， 大 多 数 人 会 花 4 美 元 来 玩 这 个 游戏 ， 可 能 还 会 多 一 点 。 很 少 有 
人 会 出 大 多 钱 玩 这 个 游戏 。 但 是 ,从 统计 学 角度 分 析 , 结果 会 是 怎样 的 呢 ? 你 最 多 应 该 出 多 少 钱 ? 


好 吧 ， 我 考虑 上 交 我 的 统计 粉丝 俱乐部 会 员 卡 ， 因 为 我 人 告诉 你 正确 答案 。 由 于 涉及 赌博 ， 
概率 的 规则 建议 人 们 应 该 不 惜 一 切 代价 玩 这 个 游戏 。 是 的 , 一 个 统计 学 家 会 告诉 你 应 不 惜 一 切 去 
玩 这 个 游戏 ! 只 要 成 本 没有 达到 无 穷 大 ， 从 理论 上 说 ， 这 就 是 一 个 好 的 赌注 。 

让 我 们 算 算 。 下 表 是 前 6 次 硬币 翻转 的 回报 : 









































翻转 可 能 性 游戏 比例 赢得 预期 支付 
1 1:2 0.50 2 美元 1 美元 
2 1:4 0.25 4 美元 1 美元 
- 1:8 0.125 8 美元 Me 
4 1:16 0.062 5 16 美 元 1 美元 
5 i 0.031 25 32 美 元 1 美元 
6 1 : 64 0.015 625 64 美 元 1 美元 








结果 : 正面 ， 你 就 赢 了 2 美元 ; 另 一 种 可 能 性 ， 反面， 你 就 会 得 到 0 美元 。 平 均 支 
出 为 1 美元 ， 一 次 硬币 抛掷 ( 事实 证 明 ， 对 于 任何 次 数 的 硬币 抛 搓 ) 的 预期 收益 是 
1 美元 。 


Sw 预期 收益 是 在 所 有 可 能 的 结果 中 ， 你 会 赢得 的 平均 金额 。 对 于 单 次 抛 挪 ， 有 两 种 





如 果 你 玩 这 个 游戏 64 次 ,你 只 在 第 六 次 撕 硬 币 中 获得 正面 , 但 你 将 赢得 64 美 元 。64 次 中 的 32 
次 ,你 只 会 万 得 2 美元 。 平 均 收益 听 起 来 较 低 : 才 1 美元 。 但 是 偶尔 会 出 现 这 种 情况 : 很 长 一 段 时 
间 内 都 没有 出 现 正 面 ， 当 正面 终于 出 现时 , 你 已 经 万 了 很 多 钱 。 当 你 开始 游戏 时 ， 你 不 知道 它 会 
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持续 多 和 久 ， 你 也 不 知道 它 可 能 会 持续 很 长 时 间 ( 像 彼得 ， 杰克 偿 的 电影 那么 长 )。 

关于 这 一 系列 的 投掷 ， 以 及 几率 随 着 奖金 上 升 而 以 同样 速率 下 降 ， 有 一 些 事情 需要 注意 。 
口 本 表 只 显示 了 掷 6 次 硬币 的 情况 。 不 过 ， 从 理论 上 讲 ， 投 掷 可 以 永远 进行 下 去 ， 一 直 不 出 
现 正面 。 
口 每 掷 一 次 硬币 ， 奖 金 数额 增加 一 倍 ， 游 戏 中 的 投掷 数量 减 半 。 
口 “ 游 戏 比 例 ” 列 的 数值 永远 不 会 增加 到 1.0 或 100%， 因 为 总 是 有 一 些 偶 然 的 机 会 ， 不 管 多 

么 小 ， 仍 需要 再 掷 一 次 。 

我 们 的 统计 粉丝 俱乐部 会 员 决定 是 否 玩 赌博 游戏 的 决策 规则 是 : 游戏 的 预期 值 是 否 大 于 玩 的 
成 本 。 预 期 值 是 通过 把 所 有 可 能 结果 的 预期 回报 相 加 计算 出 来 的 。 

你 应 该 记得 每 一 个 可 能 试验 的 预期 收益 为 1 美元 。 有 无 限 数量 的 可 能 结果 ， 因 为 硬币 可 能 永 
远 地 不 停 地 投掷 ,一 直 不 出 现 正面 。 为 了 得 到 预期 的 价值 ， 我们 把 这 一 系列 的 无 穷 的 1 美元 相 加 ， 
得 到 一 个 巨大 的 总 和 。 对 于 这 个 游戏 的 期 望 值 是 无 穷 大 的 。 因 为 当 玩 游 戏 的 成 本 低 于 预期 值 时 ， 
你 就 应 该 玩 这 个 游戏 。 只 要 玩 这 个 游戏 的 成 本 还 没 达到 无 穷 大 ， 你 就 应 该 玩 。 























4.15.3 无效 原因 


当然 ， 在 现实 生活 中 ， 人 们 不 会 为 这 样 的 游戏 支付 远 超 2 美 元 的 钱 ， 即 使 他 们 知道 所 有 的 统 
计数 据 。 没 有 人 明确 地 知道 为 什么 聪明 的 人 为 这 样 有 前 景 的 游戏 付 很 多 钱 感到 厌恶 , 但 这 里 有 一 
些 理论 能 解释 这 一 现象 。 

1. “无 限 ” 是 很 多 

即使 你 在 精神 上 接受 ， 从 长 远 来 看 比赛 是 公平 的 , 玩 很 多 、 很 多 次 的 话 偶尔 也 会 得 到 很 大 的 
回报 ， 但 是 “长 远 来 看 ”是 无 限 长 的 ， 这 是 一 个 相当 长 的 时 间 。 很 少 人 有 耐心 或 有 足够 多 的 钱 来 
玩 这 样 一 个 需要 这 么 多 耐心 和 费用 的 游戏 。 

2. 边际 效用 递减 

这 个 问题 的 鼻祖 伯 努 利 认 为 ， 人们 将 金钱 视 为 是 有 价值 的 , 但 这 种 观念 不 和 金额 成 正比 。 换 
句 话 说， 虽然 16 美 元 优 于 8 美元 , 但 16 美 元 和 8 美元 的 相对 价值 ， 和 128 美 元 与 64 美 元 的 相对 价值 ， 
是 不 一 样 的 。 

因此 ,在 某 些 时 候 ， 作 为 奖励 的 金钱 无 限 翻 倍 不 再 有 同样 的 意义 。 伯 努 利 还 相信 ， 如 果 你 有 
很 多 钱 ， 和 你 有 很 少 的 钱 相 比 ， 一 个 小 赌注 的 意义 对 后 者 来 说 更 大 。( 有 点 像 那 些 腰 缠 万 贯 的 卡 
通 人 物 用 百 元 大 钞 来 点 雪茄 。) 






















































































注 7:《 魔 戒 》 的 导演 。 一 一 译 者 注 
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3. 风险 与 报酬 

人 类 往往 倾向 于 风险 规避 。 也 就 是 说 ,它们 会 偶尔 冒险 以 换取 报酬 ,但 他 们 希望 这 种 风险 和 
成 功 的 几率 相符 。 圣 彼得 堡 游戏 有 获得 巨 奖 的 机 会 ， 这 是 事实 ,但 和 风险 相 比 ， 这 个 机 会 可 能 被 
视 作 太 小 ， 即 使 是 4 美元 的 风险 。 

4. 无 穷 不 存在 

有 些 哲学 家 会 说 ， 人 们 不 把 无 穷 的 概念 视 作 具体 存在 。 任何 通过 鼓吹 回报 无 穷 大 以 鼓励 人 们 
玩 游戏 的 摊位 ， 都 不 怎么 引 人 注 目 。 

这 也 许 就 是 我 不 买 彩票 的 原因 。 我 不 玩 彩票 ， 因 为 通过 买 彩票 ， 我 获胜 的 概率 只 增加 了 一 
点 点 。 对 于 我 来 说 ， 我 中 奖 的 概率 是 无 限 小 ， 或 非常 接近 无 限 小 ， 以 至 于 我 不 把 获奖 的 可 能 视 
作 现 实 。 





























4.15.4 人 参阅 


口 “明智 地 下 注 ”[Hack #35]。 
口 《斯 坦 福 哲 学 百科 全 书 》( Stanford Encyclopedia of Philosophy ) 中 有 关于 圣彼得堡 悖 论 的 
有 趣 朋 思虑 周全 的 讨论 。 网 址 为 : http://plato.stanford.edu/entries/paradox-stpetersburg。 
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并 非 只 有 赌博 游戏 才 有 统计 数据 。 你 可 以 使 用 游戏 专用 概率 知识 , 在 电视 真人 秀 [Hack #50]、 

富翁 游戏 [Hack #51] 或 指导 足球 队 [Hack #58] 中 取得 胜利 。 

你 在 日 常生 活 中 ， 最 常见 到 统计 的 地 方 可 能 是 体育 领域 , 虽然 “统计 ”一 词 和 统计 Hacker 
使 用 它 的 方法 并 不 完全 一 样 。 体 育 迷 们 往往 把 数据 视 作 统计 。 无论 如 何 , 有 大 量 的 Hack 可 以 帮助 
你 在 比赛 结束 前 预测 比赛 结果 [Hack #56]， 甚 至 在 比赛 开始 时 预测 结果 [Hack #55]。 

历史 是 对 未 来 的 最 佳 指 南 , 最 好 的 预测 需要 用 不 同 的 方法 来 对 球 队 和 球员 的 以 往 表现 进行 跟 
踪 、 可 视 化 [Hack #57] 和 排名 [Hack #59]。 

当然 , 如 果 你 是 一 名 真正 的 统计 黑客 , 那么 你 可 以 想 出 一 些 统计 游戏 ， 比 如 用 椰子 建立 一 个 

学 习 的 电脑 [Hack #52]， 通 过 邮件 玩 纸牌 把 戏 [Hack #53]， 让 你 的 iPod 保 持 诚实 [Hack #54]， 或 
随机 佑 计 圆 周 率 的 值 [Hack #60]: 它们 都 非常 有 趣 。 


























0 Wee EE 
0 目 Let's Make a Deal 中 ， 参 赛 者 总 是 在 3 面 窗帘 之 间 进 行 选择 。 对 于 这 些 


类 型 约 情 况 ， 有 种 统计 策略 能 玫 你 赢得 别 5 浊 而 不 是 永远 都 吃 不 完 的 Rice-A-Ronil 。 


试想 一 下 ,如 果 你 愿意 , 你 和 叔叔 弗兰克 一 起 旅行 时 正经 过 堪萨斯 通 加 诺 克 西 ( Tonganoxie， 
Kansas ) 的 未 知 区 域 。 你 们 走 到 了 一 个 岔路 口 ， 这 个 岔路 口 分 出 3 条 可 行 的 路 : A、B 和 C。 你 们 
不 知道 哪 条 岔路 口 通 往 目 的 地 : 传阅 中 世界 上 最 大 的 麻 线 球 〈 在 堪萨斯 州 的 考 克 市 )。 一 位 年 迈 





















































注 1: 一 种 盒 装 食物 ， 里 面包 含 大 米 、 意 式 细 面 和 调料 。 一 一 译 者 注 


























174 ”第 5 章 游戏 技巧 (Hack#50~#60 ) 





的 探矿 者 和 他 的 毛驴 在 十 字 路 口 休息 。 
喂 ， 老人家,” 你 说 ,“ 这 条 路 通 往 世界 上 最 大 的 麻 线 球 吗 ? ” 
嗯 ,” 他 说 ,“ 我 知道 , 但 我 是 不 会 告诉 你 的 。 不过, 我 可 以 告诉 你 其 中 有 一 条 是 正确 的 路 。 
剩 下 两 条 是 错误 的 ， 通 向 某 些 灾难 (或 者 至 少 是 年 久 失 修 的 厕所 )。 前 进 吧 ， 随 你 挑 ， 时 党 的 城 
里 人 。 你 往 前 开 ， 回 头 看 我 ， 我 不 会 给 你 走 对 了 还 是 走 错 了 的 上 暗示， 但 我 会 指向 另外 两 条 道路 的 
其 中 一 条 。 我 指出 的 那 条 路 是 错误 的 。 当 然 ， 你 仍然 不 会 知道 你 是 否 猜 对 了 ,但 我 保证 ,我 指出 
另外 两 条 路 中 的 那 条 是 错误 的 。 
你 接受 了 这 个 陌生 男人 的 建议 〈 你 有 的 选 吗 )， 让 弗兰克 叔叔 这 个 比 你 经 验 丰 富 的 赌 徒 挑选 
道路 。 他 随机 选 了 一 条 ， 你 乐观 地 走向 了 3 条 路 中 的 一 条 一 一 假设 是 A。 当 你 回头 看 时 ， 好 心 的 
探矿 者 指向 了 其 他 两 条 道路 的 一 条 一 一 假设 是 B。 你 马上 躁 刹车 ， 车 子 猛然 停 了 一 下 。 你 不 顾 弗 
兰 克 板 叔 的 反对 ， 朝 剩 下 的 道路 C 前 进 ， 并 坚信 现在 走 的 是 正确 的 道路 。 
疯 了 ， 是 吗 ?发 烧 把 脑子 烧 尝 了 ? 不， 你 刚刚 应 用 了 统计 方法 来 解决 知名 的 蒙 提 鹤 尔 问题 
( Monty Hall problem )， 并 从 3 条 路 中 选择 了 最 有 可 能 正确 的 一 条 路 。 难 以 置信 ， 对 吗 ? 继续 往 下 
读 ， 我 的 朋友 ， 准 备 记得 比 你 最 狗 狂 的 梦想 还 大 的 财富 吧 。 
在 这 种 情况 下 , 最 好 的 策略 是 违背 直觉 是 非常 怪异 的 , 以 至 于 世界 上 最 聪明 的 人 也 不 认为 它 
真 的 是 好 的 甚至 是 最 好 的 策略 。 但 相信 我 ， 它 是 。 
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5.1.1 蒙 提 替 尔 问题 和 真人 秀 策 略 


在 我 们 的 3 条 道路 和 探矿 者 的 例子 中 , 事实 上 ，C 是 正确 道路 的 几率 是 2/3 ( 67% )。 若 要 将 此 策 
略 应 用 到 更 真实 的 情况 中 , 想 想 真人 秀 节 目 中 的 选手 或 是 任何 游戏 中 的 赌 徒 , 这 些 游 戏 的 奖品 隐藏 
在 盒子 或 门 后 。 由 于 真人 秀 理 论 家 和 思维 活跃 的 统计 人 员 对 其 进行 了 深刻 的 探讨 , 这 个 问题 在 真人 
秀 节目 Lef?'s Make a Dea/ 中 相当 普遍 (20 世纪 60 年 代 至 70 年 代 是 它 的 全 盛 时 期 ), 但 它 仍然 能 在 如 
今 的 电视 真人 秀 节目 中 看 到 。Zeps Make a Deaw/ 的 主持 人 是 蒙 提 霍 尔 ， 这 个 问题 以 他 的 名 字 命名 。 

在 真人 秀 情 境 下 ,这 个 问题 是 这 样 的 。 蒙 提 给 你 呈现 三 面 窗帘 。 他 知道 每 一 个 帘子 后 面 是 什 
么 。 他 解释 说 ,一 面 窗帘 背后 是 辆 新 车 ,其 他 两 面 窗帘 后 面 是 不 值钱 的 奖品 , 蒙 提 把 它们 称 作 zonk。 
(zonk 往 往 指 驴 或 巨大 播 棒 这 类 东西 ， 没 有 任何 真正 用 处 。) 他 让 你 挑选 一 面 窗帘 ,不 管 它 后 面 是 
什么 ， 你 都 将 赢 走 它 后 面 的 东西 。 比 方 说 ， 你 挑 了 窗帘 A。 然 后 ， 他 打开 一 个 你 未 选择 的 窗帘 ， 
比如 B， 它 后 面 有 一 个 zonk。 然 后 ， 他 提供 给 你 一 个 机 会 ， 你 可 以 放弃 原来 的 选择 ， 转 而 去 选 剩 
下 的 窗帘 C。 你 应 该 改变 选择 吗 ? 

和 3 条 道路 那个 问题 一 样 ， 答 案 是 肯定 的 ， 你 应 该 改变 选择 。 第 一 次 听 到 这 个 答案 时 似乎 感 
觉 不 太 正 确 。 但 是 ， 如 果 你 想 要 提高 赢得 汽车 的 概率 ， 你 就 应 该 改变 选择 。 
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5.1.2 ”为 什么 应 该 改变 选择 


想 想 你 猜 中 窗帘 的 概率 。 我 们 假设 它 是 一 个 随机 的 猜测 一 一 没有 其 他 因素 的 和 干扰， 比如 , 我 
注意 到 一 面 帘子 动 了 ， 我 认为 它 背 后 有 一 头 驴 在 跳 。 

3 面 窗 帘 ， 只 有 一 面 帘 子 是 正确 答案 ， 这 意味 着 你 有 1/3 的 几率 猜 中 ， 从 而 赢得 汽车 。 这 大 约 
是 33%。 在 第 一 次 猜测 时 ， 没 有 额外 的 信息 ， 你 可 能 会 错 ; 事实 上 ， 你 有 2/3 的 几率 会 错 。 换 句 话 
说 ， 有 大 约 67% 的 几率 ， 这 辆 车 在 你 没有 挑选 的 那 两 面 窗帘 的 后 面 。 

你 知道 另外 两 面 窗 帘 中 , 其 中 一 面 的 后 方 一 定 没有 汽车 , 但 这 不 会 改变 这 辆 车 可 能 位 于 某 面 
未 被 选择 的 窗帘 后 面 的 概率 (67% )。 记 住 ， 不 管 你 选择 哪 一 个 ， 蒙 提 永 远 都 会 打开 一 面 错 误 的 
窗帘 。 这 辆 车 在 B 或 C 窗 帘 后 面 的 概率 为 67%, 这 仍然 正确 , 即使 B 被 揭 开 后 发 现 它 后 面 没有 汽车 。 
67% 的 概率 现在 变 成 窗帘 C 了 。 这 就 是 你 为 什么 应 该 改变 窗帘 选择 的 原因 。 









































x 如 果 给 你 机 会 ， 你 可 以 把 已 选 的 窗帘 换 为 另外 两 个 未 选 的 窗帘 ， 你 会 立刻 换 ， 不 是 
吗 ? 这 就 是 蒙 提 霍 尔 难题 的 本 质 所 在 。 


为 了 打消 你 内 心 深 处 的 怀疑 ， 我 们 可 能 还 需要 一 些 数字 支撑 。 看 一 下 表 5-1， 它 展示 了 游戏 
最 开始 3 个 选项 的 概率 分 解 。 你 有 1/3 的 几率 猜 中 、2/3 的 几率 选 到 不 能 获得 大 奖 的 窗帘 。 








表 5-1: 游戏 开始 时 汽车 所 在 位 置 的 概率 





窗帘 A 窗帘 B 窗帘 C 
33.33% 33.33% 33.33% 


表 5-2 以 不 同 的 方式 显示 了 相同 的 概率 分 布 ， 但 它 并 没有 改变 问题 的 任何 参数 。 


表 5-2: 另 一 种 关于 游戏 开始 时 汽车 所 在 位 置 的 概率 表述 


窗帘 A 窗帘 B 或 窗帘 C 
33.33% 66.66% 








表 5-3 显 示 了 蒙 提 揭示 你 未 选择 窗帘 之 一 ( 窗帘 B ) 不 是 正确 窗帘 后 的 概率 。67% 的 可 能 性 现 
在 转移 到 窗帘 C 上 了 。 





表 5-3: 窗帘 B 被 揭 开 后 汽车 所 在 位 置 的 概率 


窗帘 A 窗帘 B 窗帘 C 
33.33% 0.00% 66.66% 








在 任何 相似 情况 下 , 你 都 应 该 换 窗帘 。 当 然 , 你 可 能 是 错 的 , 但 如 果 你 接受 提供 的 交换 机 会 ， 
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那么 你 就 有 一 个 更 高 的 几率 来 赢得 汽车 ， 或 其 他 任何 你 在 玩 的 游戏 的 奖品 。 如 果 满 足下 列 标准 ， 
这 永远 是 最 好 的 策略 : 

口 主持 人 知道 每 面 帘子 后 是 什么 ; 

口 主持 人 揭 开 你 未 选择 的 窗帘 之 一 ， 奖 品 不 在 这 面 窗帘 后 面 ; 

口 你 当初 的 选择 是 随机 的 。 


即使 这 个 解决 方案 的 正确 性 不 能 立刻 体现 出 来 , 也 不 要 过 于 担心 。 真 正 聪 明 的 人 往往 会 关注 
两 面 尚未 揭 开 的 窗帘 ， 并 将 新 的 概率 看 作 50050， 因 此 ， 不 管 你 是 否 更 改选 择 ， 都 没有 关系 。 但 
是 ， 要 记 住 关键 的 一 点 : 你 最 初 挑 到 正确 窗帘 的 几率 为 33.3%， 不 管 你 作出 决策 后 发 生 了 什么 ， 
这 个 几率 都 不 会 改变 。 虽 然 专 家 有 时 不 同意 这 是 思考 此 问题 的 最 佳 办 法 。 但 即使 是 像 本 章 开 头 提 
到 的 你 在 经 过 通 加 诺 克 西 时 遇 到 的 探矿 者 一 样 聪明 的 人 ， 也 不 总 是 知道 蒙 提 霍 尔 问 题 的 正确 答 
案 。 他 赢得 了 那 头 驴 ， 你 怎么 看 ? 






































































































































争 议 

蒙 提 霍 尔 问题 以 及 由 此 导致 的 通用 真人 秀 策略 ， 最 初 由 Parade 厅 志 的 专栏 作家 玛丽 莲 ， 沃 
斯 莎 凡 特 (Marilyn Vos Savant ) 于 1991 年 介绍 给 大 众 。 因 为 她 被 称 为 “高 IQ 天 才 ”， 沃 斯 莎 几 
特 回 答 读者 的 问题 ， 有 时 其 至 是 脑筋 急 转 弯 问 题 。 有 人 把 我 刚 描述 的 问题 发 给 了 她 ， 她 发 表 了 
我 在 这 里 给 出 的 答案 。 

显然 ， 她 收 到 了 许多 信件 ， 有 些 信 表达 了 笔者 的 愤怒 。 这 些 愤怒 的 信 来 自 于 统计 学 家 、 哲 
学 家 和 声称 她 错误 的 人 。 在 学 术 期 刊 里 , 甚至 出 版 了 关于 她 的 回答 是 否 正确 的 争议 。 我 对 争议 
的 看 法 是 : 事实 证 明 ， 大 部 分 的 争论 集中 在 问题 的 关键 部 分 一 和 蒙 提 知 道 每 扇 门 后 面 是 什么 ， 
所 以 当 他 打开 第 一 面 窗帘 时 ,他 知道 后 面 是 zonk。 否 则 ， 揭 开 一 面 窗帘 不 算 作 新 信息 ， 沃 斯 莎 
凡 特 给 出 的 答案 也 值得 商 权 。 对 她 答案 的 大 部 分 批评 忽略 了 原来 出 版 问题 的 一 部 分 。 














1 四 5.2 ”经 过 GO 方 格 ， 取 得 200 美元 ， 赢 得 比赛 
有 四 大 富 分 是 一 种 几 凌 游戏 ( 几 诗 下 ) 因此 ， 赢得 游戏 的 最 佳 策略 是 充分 利用 概 鞋 。 





要 想 赢 得 非常 流行 的 帕克 兄弟 公司 (Parker Brother ) 的 棋盘 游戏 大 富翁 ， 需 要 谈判 的 技巧 、 


由 于 两 个 六 面 骨 子 (以 及 随机 洗 牌 的 一 堆 卡 牌 ) 是 决定 你 落 在 哪个 方 格 的 决定 性 因素 ， 所 以 
运气 对 结果 的 影响 不 只 一 点 点 。 争 强 好 胜 的 统计 学 家 ， 比 如 你 和 我 〈 至 少 是 我 ) 被 所 有 概率 在 其 
中 起 着 关键 作用 的 游戏 所 吸引 ,其 原因 是 , 通过 应 用 一 些 概率 基础 知识 , 我们 会 比 平时 一 般 情况 
下 顾 的 次 数 多 。 
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5.2.1 富翁 统计 基础 知识 
让 我 们 先 分 析 毛 两 个 山子 的 简单 效果 。 图 5-1 显 示 了 每 个 人 在 第 一 回合 中 ,最 常 落 入 的 方 格 。 











































































































: 入 ”| 佛蒙特 1 用 
东方 大 道 | 机 会 区 监狱 
从 GO 位 置 
括 出 6、7 或 8 
电力 公司 
国家 大 道 
从 东方 大 道 、 
机 会 或 佛 蒙 吉 尼 
特大 道 掷 出 | 亚 大 道 
6 或 8 宾 夕 法 尼 
亚 铁路 
圣人 镶 姆 
斯 广场 











图 5-1: 开局 可 能 落 入 的 方 格 


想象 一 下 ， 在 游戏 的 开始 ， 每 个 人 都 在 GO 的 位 置 。 两 个 六 面 山子 ， 有 44.5% 的 几率 ,会 扔 出 
一 个 6、7 或 是 8， 其 中 7 是 最 有 可 能 的 结果 ( 16.7% )。 那 么 ， 对 你 的 第 一 次 投掷 ， 有 一 些 方 格 更 容 
易 落 入 〈 例 如 ， 浅 蓝 色 和 弗吉尼亚 大 道 )， 有 一 些 方 格 不 那么 容易 落 入 例如， 波罗的海 大 道 或 
所 得 税 )。 仅 根据 开局 的 仍 子 投掷 来 看 ， 不 是 所 有 的 方 格 都 有 等 同 的 落 入 机 会 。 


当 从 GO 开始 时 , 甚至 都 无 法 落 入 地 中 海 大 道 , 因为 投 搓 两 个 蜗 子 得 到 1 是 不 可 能 的 。 
你 有 没有 发 现 ， 地 中 海 大 道 几 乎 总 能 成 为 在 最 后 仍然 可 以 购买 的 地 产 ? 




















GO 方 格 是 一 个 很 好 的 起 点 , 用 于 计算 落 入 方 格 的 各 种 概率 。 et i 
也 因为 那里 会 给 玩家 发 一 张 机 会 卡 。 男 一 方面 ， 如 果 一 名 玩家 击 中 了 “ 进 监狱 ”( Go to Jail ) 这 
个 方 格 , 那么 他 就 直接 进 监狱 了 , 绕 过 了 GO 方 格 。 所 以 , 落 入 GO 方 格 的 概率 不 仅 受 山子 投 撕 可 

能 出 现 的 排列 组 合 的 影响 ,同样 也 受到 各 种 机 会 卡 的 影响 。 机 会 卡 会 把 玩家 送 到 不 同 的 地 方 。 落 
入 GO 方 格 的 概率 还 受到 游戏 本 身 规 则 的 影响 ， 其 中 包括 能 产生 某 些 后 果 的 方 格 、 进 监狱 的 情况 
以 及 出 监狱 的 情况 。 

















5.2.2 ”关键 地 产 


我 一 直 以 GO 方 格 为 例 , 但 是 ， 当 然 ，GO 甚 至 都 不 是 一 个 我 们 可 以 购买 的 方 格 。 我 们 真正 想 
知道 的 是 购买 什么 地 产 , 交易 什么 地 产 和 先 建 哪 块 地 。 我 们 想 要 的 是 人 流 较 多 的 区 域 ; 房地产 成 
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功 的 秘诀 是 “位 置 ， 位置, 位置”( 显然 ， 这 些 房子 都 有 不 错 的 木质 露台 或 门廊 ， 其 中 的 原因 我 


三 








无 法 解释 )。 








表 5-4 显 示 了 考虑 所 有 规则 的 情况 下 ， 最 常 落 入 的 前 20 个 方 格 。 该 表 还 显示 了 一 名 玩家 沙 入 
其 中 一 个 方 格 的 几率 。 请 记 住 ， 方 格 “平均 ”有 2.5% 几 率 是 你 最 后 落 入 的 位 置 〈40 个 方 格 除 100 


是 2.5 )。 


表 5-4: 大 西洋 城中 最 好 的 不 动产 



















































































方 格 排 名 在 此 方 格 结束 你 回合 的 几率 
监狱 1 11.60% 
伊利 诺 伊 州 大 道 ( llinois Avenue ) 2 2.99% 
GO 3 2.91% 
B&O 铁路 4 2.89% 
免费 停车 5 2.83% 
田纳西 州 大 道 ( Tennessee Avenue ) 6 2.82% 
纽约 大 道 (New York Avenue ) 7 2.81% 
雷 丁 铁路 公司 (Reading Railroad ) 8 2.80% 
圣 詹 姆 斯 广场 ( St. James Place ) 9 2.68% 
自来水 厂 (Water Works ) 10 2.65% 
宾夕法尼亚 大 道 (Pennsylvania Avenue ) 11 2.64% 
肯塔基 大 道 ( Kentucky Avenue ) 12 2.61% 
电力 公司 ( Electric Company ) 13 2.61% 
印第安 纳 大 道 (Indiana Avenue ) 14 2.56% 
圣 查尔斯 广场 ( St Charles Place ) 15 2.56% 
大 西洋 大 道 (Atlantic Avenue ) 16 2.54% 
太平 洋 大 道 ( Pacific Avenue ) 17 2.52% 
文 特 诺 大 道 ( Ventnor Avenue ) 18 2.52% 
浮桥 ( Boardwalk ) 19 2.48% 
北 卡 罗莱 纳 州 大 道 (North Carolina Avenue ) 20 2.47% 














表 5-4 中 的 信息 来 自 Truman Collins 网 站 ， 网 站 地 址 是 http://www.tkcs-collins.com/truman/ 


monopoly/monopoly.shtml。 聪 明 的 柯 林 














斯 先生 不 但 开发 出 了 概率 树 ， 还 用 电脑 模拟 验证 这 些 值 ， 














他 为 这 些 验 证 的 值 提供 两 种 情况 : 玩家 想 尽 可 能 长 时 间 留 在 监狱 ( 为 了 赚 取 租金 ， 同 时 不 必 支 付 
租金 ); 玩家 希望 尽快 走出 监狱 (为 了 购买 还 可 以 买 的 地 产 )。 我 报告 的 值 适用 于 前 一 种 策略 。 


你 可 以 从 这 些 数据 中 得 出 一 些 重要 的 战术 结论 : 
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@ 充分 利用 监狱 

你 的 对 手 会 有 显著 的 12% 的 几率 在 监狱 方 格 里 开始 他 的 回合 。 显 然 , 持 有 以 及 开发 刚刚 被 释 
放 的 玩家 最 有 可 能 落 入 的 土地 ,是 一 个 明智 的 目标 ,这 意味 着 术 色 的 地 产 ( 圣 詹 姆 斯 和 他 的 兄弟 )， 
其 次 是 红色 ( 例如， 伊利 诺 伊 大 道 ) 和 紫色 〈 圣 查尔斯 和 他 的 朋友 )。 

@ 持 有 橙色 

权 色 地 产 共 有 3 处 ， 且 都 排 在 前 10 位 。 大 约 投掷 仍 子 12 次 会 有 1 次 落 入 田纳西 州 、 纽 约 大 道 或 
圣 和 詹姆斯 广场 。 垄 断 这 些 地 产 并 快速 发 展 ， 这 似乎 是 名 纯粹 统计 学 家 会 选择 的 战略 。 

@ 避免 远 边 

棋盘 远 边 的 地 产 一 一 绿色 、 浮 桥 和 停车 位 置 都 不 太 可 能 落 和 信 ， 即 使 游戏 进行 了 很 长 时 间 。 只 
有 浮桥 和 太平 洋 大 道 排名 靠 前 ， 上 毫 无 疑问 ,浮桥 之 所 以 排名 靠 前 是 因为 送 玩家 机 会 卡 。 这 些 地 产 
开发 起 来 最 昂贵 ， 所 以 将 这 些 克 断 纳 入 游戏 计划 有 点 冒险 。 


5.2.3 ”大 富翁 监狱 系统 的 重要 性 


如 果 没 有 统计 分 析 , 监狱 和 “ 进 监狱 ” 方 格 在 房地产 整体 价值 中 发 挥 的 作用 可 能 就 不 是 那么 
清楚 。 玩 家 硕 望 监狱 可 以 销售 。 玩 家 在 监狱 方 格 里 开始 或 结束 自己 回合 的 频率 ， 比 他 们 落 入 棋盘 
上 任意 垄断 地 产 的 频率 要 高 。 络 绎 不 绝 的 刑 满 释 放 人 员 如 洪水 一 般 穿 越 棋盘 的 一 边 , 这 增加 了 去 
往 伊 利 诺 伊 州 一 路 上 收取 物业 租金 的 几率 。 

玩家 在 经 过 街头 时 必须 给 其 他 玩家 支付 租金 ， 这 时 候 监狱 也 可 以 提供 一 个 受 欢 迎 的 器 息 机 
会 , 但 是 在 游戏 初期 , 监狱 会 阻止 你 购买 你 梦想 的 地 产 。 监 狱 重要 性 的 最 后 一 点 : 只 有 一 个 方 格 ， 
你 永远 无 法 结束 你 的 回合 。 你 能 说 出 它 来 吗 ? 进 监狱 (Goto Jail )。 






























































5.2.4 参阅 


口 比尔 巴特 勒 运行 另 一 个 网 站 ， 介 绍 与 大 富翁 相关 的 概率 : http;//www.durangobill.com/ 
Monopoly.html。 此 外 ， 该 网 站 举办 了 一 个 讨论 : 当 一 个 人 和 希望 他 的 计算 涵盖 大 富翁 游戏 
的 每 一 个 现实 细节 时 ， 涉 及 的 困难 难以 想象 。 比 如 ， 追 踪 一 张 特定 的 机 会 卡 或 公益 卡 是 
否 发 出 。 

口 落 如 一 个 方 格 的 概率 计算 公式 〈 在 这 个 例子 中 用 英国 伦敦 、 英 格 兰 、 街 道 名 称 )， 可 以 在 
这 里 找到 : http:/hometown.aol.co.uk/monopolycheat/prob/method.html。 


TD 5.3 使 用 随机 选择 的 人 工 智 能 
52 在 微 处 理 器 发 明之 前 ,统计 党 家 已 经 能 够 构建 智能 的 、 有 学习 能 力 的 电脑 。 你 可 以 
使 用 椰子 过 和 梳 率 规律 来 建造 一 全会 学习 的 、 在 井 字 游 驱 上 永 不 葵 的 电脑 。 
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有 一 个 笑话 说 的 是 20 世 纪 60 年 代 的 电视 节目 《吉利 根 岛 》( Gilligan*s 1sland ): 教授 总 是 用 椰 
子 和 有 苹 葛 制造 电脑 、 洗 衣 机 或 火箭 船 。 我 感觉 制造 洗衣 机 和 火箭 船 听 起 来 不 切实 际 , 但 是 漂流 者 
完全 可 以 用 椰子 制 出 电脑 。 你 也 可 以 做 到 。 如 有 果 你 曾经 被 困 在 一 个 范 岛 上 , 想 要 有 个 同伴 ， 造 一 
部 电脑 吧 。 

你 不 用 像 《 匾 岛 余 生 》( Castaway ) 里 汤姆 . 汉 克 斯 扮演 的 角色 一 样 想 要 一 个 排球 ， 排 球 没 
有 什么 个 性 ,但 你 的 电脑 能 和 你 一 起 玩 游戏 ,甚至 会 学 习 , 并 能 因此 变 得 更 聪明 。 学 习 算 法 背后 
的 驱动 力 来 自 几率 和 随机 选择 。 









































5.3.1 试 误 学 习 

据 行为 心理 学 家 分 析 ， 所 有 动物 (包括 人 类 、 水 猎 和 单 细胞 生物 ) 的 学 习 方 式 都 基本 相同 。 
经 验 告诉 我 们 不 同 选择 导致 不 同 结果 。 由 于 动物 接收 结果 的 反馈 ,所 以 它 就 适应 了 。 如 果 结 果 是 
加 极 的 ， 这 个 生物 更 有 可 能 在 不 久 的 将 来 作出 同样 的 选择 。 如 果 结 果 是 消极 的 ， 这 个 生物 不 太 可 
能 再 一 次 作出 这 样 的 选择 。 
请 注意 , 我 们 并 没有 保证 一 个 “好 ”的 行为 总 是 会 反复 进行 , 或 保证 不 良 的 行为 会 逐渐 灭绝 ， 
它 只 是 概率 问题 。 动物 更 可 能 作出 正确 的 决策 , 而 不 太 可 能 作出 错误 的 决策 。 为 了 使 一 台 机 器 模 
仿 动物 的 学 习 方 式 ， 我 们 必须 从 这 个 概率 角度 来 建立 机 器 。 

玩 游戏 反映 了 很 多 试 错 的 学 习 过 程 ， 因 为 结果 很 容易 被 解释 为 积极 的 ( 赢 ) 或 消极 的 ( 输 )。 
在 游戏 中 ， 反 馈 往 往 是 即时 的 ， 而 研究 表明 ， 选 择 和 反馈 之 间 的 时 间接 近 程 度 是 学 习 (learning ) 
是 否 发 生 的 关键 因素 。 请 记 住 ,学 习 在 这 里 被 定义 为 : 正确 选择 的 可 能 性 增加 或 不 正确 选择 的 可 
能 性 减少 。 













































































5.3.2 ”建立 一 个 井 字 机 器 


被 困 在 岛 上 时 , 没有 朋友 的 你 或 许 希望 通过 和 智能 对 手 玩 游戏 来 打发 无 聊 时 间 。 下 面 是 建立 
一 个 不 使 用 任何 电 或 硅 的 奇妙 装置 的 指令 ， 这 个 装置 会 玩 游戏 ， 并 具备 像样 的 竞争 力 。 

这 款 机 器 会 学 习 : 你 和 它 对 战 的 次 数 越 多 ， 它 就 变 得 越 强 。 这 个 机 器 玩 的 是 井 字 游 戏 , 但 理 
论 上 来 说 , 你 可 以 使 用 同样 的 原理 来 建立 任意 的 双人 战略 游戏 装置 。 井 字 游 戏 很 简单 ， 它 很 好 地 
展示 了 设计 、 制 造 和 操作 方法 。 

如 果 《 吉 利根 岛 》 里 的 教授 曾经 用 椰子 制造 出 一 部 电脑 ， 他 很 可 能 受到 生物 学 家 唐纳德 . 米 
基 ( Donald Michie ) 的 开创 性 工作 和 他 那 火柴 盒 的 影响 。1963 年 , 米 基 在 《电脑 杂志 》( Computer 
Journal ) 的 第 一 期 发 表 了 一 篇 文章 ,吉利 根 和 他 的 好 朋友 被 困 在 岛屿 上 是 知 干 年 后 的 事 了 。 米 基 
介绍 了 他 是 如 何 设 计 的 ， 并 的 确 使 用 下 列 完整 列表 制造 了 一 个 不 用 电 的 电脑 。 
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e@ 287 个 火柴 金 

火柴 盒 有 个 可 以 打开 的 小 抽 敢 。 米 基 在 每 个 火柴 盒 上 标记 出 井 字 游 戏 中 可 能 出 现 的 287 种 不 
同 结果 中 的 一 种 。 其 实 有 更 多 的 可 能 位 置 ， 但 由 于 3 行 3 列 的 标准 井 字 布局 是 对 称 的 ， 因 此 4 种 不 
同 特 征 的 位 置 可 以 只 用 一 个 位 置 来 概括 表示 。 在 游戏 中 的 每 一 时 刻 ,“ 棋 盘 ” 的 当前 布局 将 操作 
人 员 引 导 到 相应 的 火 上 某 盒 。 

@ 大 量 供 应 的 9 种 不 同 颜色 的 珠子 

这 9 种 颜色 代表 井 字 棋盘 的 9 个 不 同 空间 。 最 开始 ， 每 一 个 火柴 盒 里 的 珠子 数 等 于 下 一 步 
的 移动 数 ， 且 珠子 颜色 和 可 移动 空间 对 应 。 只 有 代表 合法 移动 的 珠子 会 被 放 在 相应 盒子 里 。 当 
然 ， 不同 的 位 置 和 火柴 盒 ， 只 对 应 一 小 组 合法 的 下 一 步 移动 ， 所 以 每 个 盒子 里 都 混杂 着 不 同 颜 
色 的 珠子 。 

教授 可 能 会 用 椰子 壳 代 替 火 柴 盒 ,用 沙 卵 石 或 种 子 ( 或 许 用 豪 威 尔 先生 存 钱 饶 里 的 钱 ,， 他 一 
直 随 身 携 带 存 钱 缸 ) 代替 珠子 。 从 你 所 处 的 热带 环境 里 收集 这 些 物资 , 将 卵石 填充 的 椰子 进行 有 
效 分 组 ， 你 就 有 了 可 以 在 荡 岛 上 玩 游戏 的 电脑 。 是 的 ， 你 需要 费力 找到 287 个 椰子 ,但 你 有 其 他 
更 好 的 事情 可 做 吗 ? 






































5.3.3 ”操作 电脑 

为 了 和 你 那 “ 卵 石 供电 ”的 电脑 玩 游戏 ， 请 按 以 下 说 明 进 行 操作 。 

(1) 电脑 先 走 。 找 到 标记 有 当前 位 置 的 椰子 。( 对 于 第 一 步 ， 这 是 一 个 空白 的 布局 。) 闭 上 你 
的 眼睛 并 随机 抽出 一 块 卵石 。 

CO) 在 你 的 棋盘 上 ， 在 卵石 颜色 指示 的 地 方 标记 一 个 X (我 假定 是 在 沙 上 画 )。 将 卵石 放 在 一 
个 安全 的 地 方 。 

(G3) 作出 你 的 移动 ， 在 你 选择 的 地 方 标记 一 个 O。 

(4) 目前 在 棋盘 上 有 一 个 新 位 置 了 。 转 至 相应 的 椰子 ， 从 里 面 随机 抽出 一 块 卵石 。 回 到 
第 2 步 。 

(5) 重复 步骤 2 至 步骤 4， 直 到 有 一 人 胜出 或 平局 。 

接 下 来 发 生 的 事情 是 最 重要 的 部 分 , 因为 它 能 让 电脑 学 会 如 何 玩 得 更 好 。 行为 心理 学 家 二 
种 最 后 阶段 称 作 强 化 (reinforcement )。 


如 果 电 脑 输 了 ， 你 通过 把 从 椰子 中 随机 抽取 的 卵石 扔 到 海里 来 “惩罚 ” 它 。 


如 果 机 器 启 了 或 打 成 平 局 , 将 鹅卵石 放 回 到 它们 原来 所 在 的 椰子 里 , 并 通过 和 额外 加 入 一 颗 颜 
色相 同 的 卵石 来 “奖励 ” 它 。 
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5.3.4 生效 原理 
奖励 或 惩罚 电脑 的 过 程 基本 上 复制 了 动物 的 学 习 过 程 。 积 极 结果 导致 奖励 行为 可 能 性 的 增 
加 ,而 消极 结果 导致 惩罚 行为 可 能 性 的 降低 。 通 过 添加 或 删除 卵石 ,你 的 确 是 增加 或 减 小 机 器 在 
游戏 中 作出 某 种 移动 的 真实 可 能 性 。 
考虑 游戏 进行 到 如 下 阶段 ， 电 脑 的 移动 用 X 表 示 ， 现 在 电脑 必须 走 棋 : 


X O X 
O 












































你 可 能 意识 到 最 好 且 唯 一 的 可 行走 棋 是 电脑 把 X 放 在 底部 中 间 来 阻止 你 获胜 。 但 是 ， 电 脑 意 
识 到 几 种 可 能 性 。 它 考虑 任何 合法 的 移动 。 电 脑 考虑 的 两 种 走 棋 方 法 (这 实际 上 意味 着 ， 它 将 允 
许 被 随机 地 从 椰子 这 中 取出 来 ) 一 个 是 最 好 的 走 棋 ， 一 个 是 最 坏 的 走 棋 : 















































X O X X O X 
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X X 














如 果 电 脑 第 一 次 玩 这 个 游戏 ,这 两 种 走 棋 ( 或 行为 ) 发 生 的 可 能 性 等 同 。 在 这 种 情况 下 ,其 
他 走 棋 也 有 可 能 , 它们 发 生 的 可 能 性 也 相同 , 左边 的 走 棋 可 能 不 会 导致 失败 , 至 少 不 会 立即 失败 ， 
所 以 代表 那 步 移动 的 卵石 被 添加 到 椰子 中 ,相对 于 其 他 走 棋 ,这 种 走 棋 的 相对 概率 增加 了 。 右边 
的 走 棋 很 可 能 以 失败 告终 除非 和 吉利 根 比赛 ,也许 吧 )， 所 以 这 种 走 棋 下 次 被 选中 的 几率 在 数 
学 上 减少 了 ， 因 为 可 供 随机 选择 的 这 种 颜色 的 卵石 数量 变 少 了 。 
任何 给 定 的 走 棋 被 选中 的 概率 可 以 通过 这 个 简单 的 公式 表示 : 
表示 走 棋 的 卵石 数量 
对 应 当前 棋盘 布局 的 椰子 中 的 卵石 总 数 
机 器 开始 时 有 相等 数目 的 卵石 ， 或 者 ， 换 句 话说， 任何 一 系列 的 走 棋 被 选中 的 概率 相等 。 当 
然 ,一些 走 棋 在 我 们 经 验 丰 富 的 玩家 眼 里 是 非常 思春 的 , 在 真正 的 游戏 中 绝 不 会 作出 那些 思春 的 
行为 ,除了 非常 幼稚 的 玩家 。 但 是 行为 心理 学 家 争论 的 问题 是 : 所 有 生物 ,在 它们 建立 一 个 大 型 
的 经 验 池 前 都 是 新 手 。 这 种 经 验 池 塑造 了 它们 行为 中 的 基础 概率 。 

























































































5.3.5 剖析 本 条 Hack 


可 以 用 几 种 方法 修改 你 的 机 器 , 使 它 变 得 更 聪明 。 例 如 , 对 平局 和 获胜 采用 不 同 的 奖励 方法 。 
这 应 该 会 更 快 地 培养 出 一 个 好 玩家 。 米 基建 议 获 胜 奖励 三 个 珠子 ， 平 局 奖励 一 个 珠子 。 
如 果 你 想 模拟 动物 的 学 习 过 程 , 那 你 可 以 调整 系统 , 使 临近 游戏 结束 时 的 走 棋 比 开始 时 的 走 
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棋 更 加 重要 。 这 是 为 了 反映 这 样 一 种 观察 : 当 强 化 最 接近 行为 发 生 时 ， 强 化 是 最 有 效 的 。 在 井 字 
游戏 中 ,对 于 导致 立即 输 掉 的 错误 ， 应 予以 更 有 效 的 处 理 和 惩罚 。 在 游戏 后 期 ， 随 着 用 来 走 棋 的 
珠子 越 来 越 少 ， 学 习 的 发 生 会 更 快 。 

一 个 明显 能 使 电脑 变 得 更 聪明 的 升级 是 : 其 至 不 容许 电脑 下 坏 棋 ， 即 不 把 代表 会 导致 立马 
输 掉 的 卵石 放 到 你 的 容器 里 。 这 会 解决 电脑 开始 时 智力 低下 的 问题 ,但 它 并 没有 真正 体现 动物 
的 学 习 方式 。 所 以 ， 虽 然 这 可 能 是 一 个 强大 的 竞争 对 手 ， 但 教授 会 因 你 缺乏 科学 的 严谨 性 而 感 
到 失望 。 


i a 5.4 信件 传递 的 卡 牌 伎俩 
有 立 理 说 、 沈 好 的 纸牌 应 该 是 刹 机 的 。 科 学 分 析 表 明 它 实际 上 不 是 简 机 的 ,你 可 以 充分 
利用 斥 牌 分 布 的 已 知 拔 率 来 对 陌 主 人 展现 一 个 惊人 的 纸牌 颈 法 。 


想象 一 下 ,你 在 邮箱 里 收 到 一 个 厚 厚 的 、 神 秘 的 信封 。 你 没有 将 它 交 给 最 近 的 国家 安全 人 员 
人 处理 ， 而 是 打开 了 它 ， 你 在 里 面 发 现 了 一 副 普 通 的 扑克 牌 以 及 下 面 一 组 说 明 : 


(1) 切 牌 ; 

(2) 用 交友 式 洗 牌 法 (在 本 Hack 后 面 会 定义 ) 洗 一 次 牌 ; 

(3) 再 次 切 牌 ; 

(4) 再 次 使 用 交 又 式 洗 牌 法 洗 一 次 牌 ; 

(5) 再 次 切 牌 ; 

(6) 取 下 卡 牌 顶部 的 那 张 牌 ， 把 它 记 下 来 ， 并 将 其 随机 放 回 卡 牌 里 ; 

(7) 再 次 切 牌 ; 

(8) 重新 洗 牌 ; 

(9) 再 切 牌 一 次 ; 

(10) 把 这 副 牌 邮寄 回 附 上 的 地 址 (在 堪萨斯 州 的 通 加 诺 克 西 ， 或 其 他 一 些 让 人 想起 奇迹 和 奇 
思 妙 想 的 地 方 )。 

你 遵循 这 些 说 明 ( 同时 还 戴 着 防护 橡胶 手套 )， 把 这 副 牌 邮寄 回去 。 大 约 一 周 过 后 ， 你 收 到 
一 个 小 信封 。 里 面 正 是 你 选择 的 那 张 卡 ! (也 有 可 能 是 300 美 元 的 请 求 和 预测 你 未 来 的 邀约 , 此 时 
的 你 只 需 扔 掉 那 个 邀约 即 可 。) 


令 人 惊异 ， 是 吗 ? 不 可 能 的 ， 你 说 呢 ? 混 洗 卡 牌 的 已 知 可 能 分 布 使 这 变 得 很 有 可 能 ， 甚 至 像 
是 都 不 需要 报名 到 霍 格 沃 英 学 校 ( Hogwarts ) ? 
学 习 。 
















































































注 2:《 哈 利 : 波 特 》 里 的 魔法 学 校 。 一 一 译 者 注 
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5.4.1 生效 原理 


从 数学 上 来 讲 , 大 家 已 经 熟知 一 副 扑克 牌 各 种 类 型 的 洗 牌 效果 。 虽 然 彻 底 的 洗 牌 ( 如 燕尾 或 
交 治 式 洗 牌 ,使 卡 牌 的 两 半 交 织 在 一 起 ) 是 为 了 真正 把 一 副 牌 洗 成 完全 不 同 于 原 有 次 序 的 新 次 序 ， 
但 是 即使 经 过 多 次 切 牌 和 洗 牌 ， 原 始 卡 牌 的 部 分 序列 ， 依 然 保 持 着 原 有 的 秩序 。 

统计 学 家 已 经 分 析 了 这 些 模式 并 把 它们 发 表 在 学 术 期 刊 上 。 这 工作 类 似 于 这 样 的 开创 性 建 
议 ， 即 为 了 在 下 一 轮 手 牌 前 获得 扑克 、 黑 桃 或 桥牌 的 最 佳 组 合 ， 应 该 洗 正 好 7 次 牌 。 

想象 一 副 以 某 种 次 序 排列 的 扑克 牌 。 一 轮 洗 牌 后 ， 如 果 洗 牌 是 完美 的 ,我 们 仍然 可 以 在 混合 
分 布 的 卡 牌 里 发 现 原来 的 次 序 。 事实 上 , 现在 的 次 序 是 两 种 原来 次 序 的 相互 重合 , 并 且 通 过 交替 
选 牌 ， 你 可 以 重 构 原 来 所 有 的 次 序 。 

表 5-5 显 示 了 一 副 扑 克 牌 进行 一 次 完美 洗 牌 的 前 后 情况 。 为 高 效 起 见 ， 只 显示 了 12 张 牌 ， 但 
这 些 原则 适用 于 一 副 完整 的 52 张 扑克 牌 。 





















































表 5-5: 完美 洗 牌 对 卡 牌 分 布 的 影响 








洗 牌 之 前 洗 牌 之 后 
1. 方 片 A 1. 方 片 A 
2. 方 片 2 7. 方 片 7 
3. 方 片 3 2. 方 片 2 
4. 方 片 4 8. 方 片 8 
5. 方 片 5 3. 方 片 3 
6. 方 片 6 9. 方 片 9 
7. 方 片 7 4. 方 片 4 
8. 方 片 8 10. 方 片 10 
9. 方 片 9 5. 方 片 5 
10. 方 片 10 11. 方 片 11 
11. 方 片 11 6. 方 片 6 
12. 方 片 12 12. 方 片 12 








如 果 知 道 这 12 张 牌 的 开始 顺序 , 你 可 以 在 新 牌 组 里 每 隔 一 张 进 行 查看 ,就 能 够 相当 容易 地 把 
它 挑 出 来 。 这 些 子 模式 的 特点 是 保持 上 升 的 序列 : 当 你 沿 着 卡 牌 顺序 移动 时 , 卡 牌 的 面值 在 上 升 。 
如 果 卡 牌 以 一 个 很 长 的 上 升序 列 (或 者 4 组 ， 因 为 有 4 种 花色 ) 开始 ， 铝 尾 洗 牌 也 将 保持 这 些 上 升 
序列 ， 它 们 只 是 交织 在 一 起 而 已 。 即 使 经 过 多 次 洗 牌 ， 铝 尾 洗 牌 也 将 保持 这 些 上 升序 列 。 

如 果 在 洗 牌 和 切 牌 过 程 中 的 任意 时 刻 从 卡 牌 中 抽取 一 张 牌 ， 并 有 目的 地 插入 卡 牌 的 其 他 地 
方 ， 和 总 体 的 上 升格 局 序列 相 比 ， 这 会 出 现 “ 出 位 ”( out of place ) 的 情况 。 当 然 ， 这 也 正 是 卡 
牌 伎俩 的 说 明 所 要 求 的 ， 这 也 解释 了 你 那 神秘 的 魔法 师 (或 者 当 你 假定 自己 是 这 个 角色 的 时 候 ) 
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是 如 何 发 现 哪 张 牌 被 抽取 了 的 。 

对 于 表 5-5 所 示 的 顺序 ， 我 们 想象 把 方 片 A〈 原 序列 第 1 位 ) 从 卡 牌 的 顶部 移出 并 随机 放置 在 
卡 牌 中 间 的 某 处 。 比 方 说 ， 方 片 A 最 终 在 方 片 4 和 方 片 10 之 间 【〈 在 新 分 布 的 第 4 位 和 第 10 位 之 间 )。 
从 现在 开始 ， 它 的 顺序 永久 是 错乱 的 ， 再 怎么 洗 牌 都 不 可 能 将 其 移动 至 原 属 的 位 置 。 
































如 果 我 们 把 一 副 扑 克 牌 看 做 是 一 个 无 限 循环 ,那么 洗 牌 过 程 中 的 切 牌 不 会 影响 整个 
序列 。 但 是 ， 非 标准 洗 牌 ， 比 如 将 卡 牌 三 等 分 切 分 ， 并 在 洗 牌 之 前 改变 这 三 等 分 的 
顺序 将 会 破坏 序列 。 神 奇 的 伎俩 说 明 必 须 明 确 表 示 ， 卡 牌 应 一 次 分 成 两 堆 。 





当然 ， 如果 分 析 现 实生 活 中 玩 扑 殉 牌 时 会 发 生 什么 ， 就 必须 考虑 人 的 影响 ,毕竟 是 人 就 会 犯 
错 。 正 如 哲学 家 说 的 那样 ,“ 洗 牌 粳 糕 的 是 人 类 ”。 在 一 次 完美 镶 尾 洗 牌 中 ,有些 卡 牌 本 应 正好 被 
一 张 卡 牌 所 分 离 ， 但 也许 有 些 不 可 预期 的 因素 ,使 这 些 卡 牌 被 两 张 卡 牌 所 分 离 ， 或 可 能 仍然 相 邻 
并 没有 被 分 离 。 表 5-6 显 示 了 一 个 更 人 性 化 的 、 不 完美 洗 牌 的 可 能 结果 。 


表 5-6: 马虎 的 洗 牌 对 卡 牌 分 布 的 可 能 影响 











洗 牌 前 真实 的 人 类 鸽 尾 洗 牌 后 
1. 方 片 1. 方 片 A 
2. 方 片 2 7. 方 片 7 
3. 方 片 3 8. 方 片 8 
4. 方 片 4 2. 方 片 

5. 方 片 5 3. 方 片 3 
6. 方 片 6 9. 方 片 9 
7. 方 片 7 10. 方 片 10 
8. 方 片 8 5. 方 片 5 
9. 方 片 9 4. 方 片 4 
10. 方 片 10 11. 方 片 11 
11. 方 片 11 6. 方 片 6 
12. 方 片 12 12. 方 片 12 














这 种 实际 洗 牌 中 的 随机 性 , 不 但 产生 一 个 困境 ,还 创造 了 一 个 机 会 。 困 境 是 , 现在 不 能 准确 
识别 哪 张 卡 是 乱 序 的 ， 因 为 该 序列 不 能 被 完全 重建 ， 魔 术 师 必须 依靠 一 点 概率 ,这 就 给 伎俩 增加 
了 一 些 风险 。 

当 这 个 伎俩 的 观众 意识 到 你 不 可 能 实现 完美 洗 牌 时 , 机 会 出 现 了 。 当 你 在 这 种 随机 不 确定 中 ， 
不 管 以 何 种 方式 选 出 那 张 卡 牌 ， 观 众 的 困惑 都 会 更 大 。 
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5.4.2 成 功 的 概率 


因为 不 知道 卡 牌 乱 序 的 确切 性 质 , 魔法 师 能 够 识别 出 顺序 错乱 的 那 张 卡 牌 只 是 因为 洗 牌 不 够 
完美 。 此 外 ， 如 果 一 张 牌 从 卡 牌 顶部 取出 后 又 放 回 到 卡 牌 中 间 ， 此 时 指令 不 再 允许 切 牌 或 洗 牌 ， 
那么 这 个 伎俩 更 容易 成 功 ( 只 有 一 张 卡 是 乱 序 的 )。 

哥伦比亚 大 学 和 哈佛 大 学 的 统计 学 家 戴 夫 ' 拜耳 ( Dave Bayer ) 和 佩 尔 西 * 戴 康 尼斯 (Persi 
Diaconis ), 按照 这 种 神奇 伎俩 所 描述 的 方式 混合 了 一 副 扑 克 牌 ,对 洗 过 的 扑克 牌 的 可 能 结果 做 了 
数学 上 的 探索 。( 想必 任教 于 这 些 机 构 的 教员 都 有 很 多 空闲 时 间 ? ) 他 们 为 识别 一 张 错位 的 卡 牌 
而 开发 出 了 一 个 数学 公式 , 并 进行 了 一 百 万 次 电脑 模拟 测试 他 们 的 “网 络 巫师 ”所 选 卡 牌 的 准确 
性 。 他 们 的 分 析 假 定 是 完美 的 燕尾 洗 牌 。 他 们 发 现 ， 只 洗 几 次 牌 时 ， 这 个 伎俩 表现 得 相当 不 错 ， 
但 是 随 着 允许 越 来 越 多 次 数 的 洗 牌 ， 成 功 的 几率 迅速 下 降 。 

表 5-7 显 示 了 对 52 张 牌 进行 不 同 次 数 的 洗 牌 时 成 功 的 概率 ， 也 展示 了 如 果 人 允许 一 次 以 上 的 猜 
测 ， 正 确 的 卡 牌 被 选中 的 几率 。 


表 5-7: 看 似 不 可 能 的 成 功 几率 





















































猜测 次 数 2 次 洗 牌 3 次 洗 牌 4 次 洗 牌 5 次 洗 牌 6 次 洗 牌 
1 99.7 % 83.9 % 28.8% 8.8% 4.2% 

2 100 % 94.3 % 47.1 % 16.8% 8.3% 

3 100 % 96.5 % 59.0% 23.8% 12.3% 


当然 ， 当 人 们 考虑 现实 世界 洗 牌 的 随机 误差 时 ,成 功 的 几率 会 小 幅 下 滑 , 但 相对 的 成 功率 仍 
然 如 表 5-7 所 示 。 如 果 你 像 描 述 的 那样 执行 这 个 伎俩 一 一 3 次 洗 牌 后 猜 1 次 ， 那 么 你 猜测 正确 的 几 
率 大 约 是 80% (考虑 到 精 糕 的 洗 牌 ， 实 际 正确 的 几率 比 估计 的 83.9% 低 一 点 )。 

为 了 确保 这 个 伎俩 的 实施 ， 你 可 能 需要 至 少 3 个 人 。 那 么 ， 假 设 每 个 人 的 可 能 性 为 80%， 你 
会 让 这 3 人 中 至 少 一 人 惊奇 的 几率 增加 至 98.4%， 这 几乎 是 一 个 必然 。 如 果 你 3 次 都 错 了 ， 那 就 别 
再 对 这 些 人 说 话 或 写 信 ， 关 闭 你 的 邮箱 ， 并 专注 于 生活 中 更 重要 的 事情 。 毕 竞 ， 如 果 辛 勤 工 作 ， 
未 来 某 天 你 有 可 能 会 进入 哥伦比亚 大 学 或 哈佛 大 学 ， 做 真正 重要 的 东西 。 


















































5.4.3 ”参阅 


口 拜耳 和 戴 康 尼 斯 的 研究 出 现在 1992 年 《应 用 概率 年 鉴 》( The Annals of Applied Probability ) 
的 第 2 期 ，294~313 页 。 在 那 篇 文章 里 ， 他 们 引述 了 两 位 魔法 师 的 研究 成 果 ， 这 两 位 都 是 
研究 上 升序 列 原理 卡 牌 技巧 的 早期 开发 人 员 ( 如 下 所 示 ): 

口 Williams, C.0. (1912). “A card reading.” The Magician Monthly, 8, 67. 

口 Jordan, C.T. (1916).“Long distance mind reading.”7The Sphinx, 15, 57. 这 是 本 Hack 所 描述 效 

果 的 依据 。 
























































5.5 ”检查 你 iPod 的 诚实 性 187 





JI 5.5 检查 你 iPod 的 诚实 性 
1 检查 你 iPod 的 诚实 1 


投 出 你 的 Pod“ 蕊 机 ” 打 乱 顺序 的 真正 随机 程度 。 


苹果 公司 的 iTunes 是 允许 你 在 让 od 上 播放 歌曲 的 软件 ， 其 中 个 性 化 的 歌曲 评级 可 以 让 你 迅速 
找到 你 的 最 爱 ， 这 有 助 于 派对 随机 播放 ( Party Shuffle ) 功能 更 多 地 播放 你 最 喜欢 的 歌曲 。iTunes 
挑选 播放 列表 里 下 一 首 歌 时 使 用 的 算法 是 : 从 你 的 最 爱 里 随机 选择 。 但 它 是 真 的 随机 吗 ? 

在 iTunes 里 ， 如 果 你 反复 听 到 音乐 库 里 一 位 艺术 家 的 歌曲 ， 你 可 能 会 认为 你 的 播放 器 有 它 自 
己 的 偏好 。 不 过 苹果 声称 iTunes 里 的 歌曲 的 打 乱 算法 是 完全 随机 的 。 打 乱 算 法 选择 的 歌 是 无 放 回 
的 。 也 就 是 说 , 就 像 遍 历 一 副 洗 好 的 扑克 牌 一 样 , 在 你 听 完 所 有 歌 之 前 , 每 首 歌 只 会 听 到 一 次 (或 
在 你 停止 播放 前 ， 或 选择 不 同 的 播放 列表 前 )。 

iTunes 中 的 派对 随机 播放 是 另 一 回 事 。 其 算法 选择 的 歌 明 是 有 放 回 的 ， 这 意味 着 每 首 歌曲 播 
放 后 整个 音乐 库 被 重新 打 乱 ( 就 像 每 次 抽出 一 张 牌 后 重新 对 整 副 牌 再 洗 一 次 )。“ 较 多 播放 评级 较 
高 的 歌曲 ”选项 的 确 做 到 了 较 多 次 地 播放 高 评级 的 歌曲 ， 但 对 高 评级 的 歌曲 有 多 少 偏好 ? 
































网。 本 Hack 最 初 在 OmniNerd 网 站 上 http://www.omninerd.com/ 以 一 篇 文章 的 形式 出 现 。 


5.5.1 评估 iTunes 的 筛选 过 程 

我 想 测 试 两 种 不 同 的 歌曲 选项 : 派对 随机 播放 和 “ 较 多 播放 评级 较 高 的 歌曲 “。 我 创建 6 首 
歌 的 短 播 放 列 表 : 5$ 个 星 级 中 每 个 星 级 选 一 首 ， 剩 下 的 那 首 是 没有 评级 的 。 这 些 歌曲 属于 同一 流 
派 和 艺术 家 ， 并 把 每 首 歌 的 播放 时 长 改 为 具有 一 秒 钟 。 




















我 在 iTunes 5 版 本 上 进行 我 的 测试 。iTunes 6 增加 了 智能 随机 播放 功能 ， 这 可 能 会 降 
低 连 续 听 到 同一 艺术 家 或 专辑 的 几率 ， 但 我 没有 测试 它 。 


重 置 播放 计数 为 零 后 ,我 点 击 播放 按钮 ， 然 后 离开 我 的 办 公 昌 去 度 周 末 。 对 这 些 歌 我 会 播放 
两 次 : 一 次 选择 随机 ( 派对 随机 播放 )， 一 次 选择 随机 和 “ 较 多 播放 评级 较 高 的 歌曲 ”选项 。 表 
5-8 显 示 了 在 星期 一 早晨 的 播放 计数 。 








表 5-8: 歌曲 选择 的 分 布 











随机 选择 基于 评级 
歌曲 评级 播放 次 数 百分比 播放 次 数 百分比 
没有 评级 9105 16.70% 2052 3.9% 
1 9055 16.60% 6238 11.8% 
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( 续 ) 
随机 选择 基于 评级 

歌曲 评级 播放 次 数 百分比 播放 次 数 百分比 
2 9090 16.67% 8125 15.4% 
3 9114 16.71% 10 020 18.9% 
4 9027 16.55% 12 158 23.0% 
5 9146 16.77% 14 293 27.0% 
总 计 54 537 100% 52 886 100% 








在 随机 试验 中 , 所 有 歌 的 播放 次 数 都 非常 接近 ， 和 随机 选择 预期 的 一 样 。 对 于 基于 歌曲 评级 








(或 评价 偏向 选择 ) 的 试验 ， 





好 算法 对 训 








级 一 直下 降 ， 星 级 评级 每 下 降 一 级 ， 线 性 偏好 就 下 降 4% 左 右 ， 但 从 一 星 级 到 无 评级 ， 降 由 
了 ， 有 8% 的 下 降 。 虽 然 一 星 级 似乎 是 最 低 的 等 级 ， 但 没有 评级 才 是 真正 的 害群之马 。 

你 的 记 od 假 定 : 如 果 你 对 一 首 歌 没有 进行 星 级 评定 ， 那 么 相 比 那些 你 给 最 低 评级 的 

歌曲 ， 你 更 不 想 听 到 这 些 没有 评级 的 歌曲 。 这 有 点 像 选择 一 部 差 评 的 电影 ， 而 不 选 

择 暂 时 没有 任何 评价 的 电影 。 

图 5-2 显 示 了 不 同 的 歌曲 选择 选项 的 效果 。 你 可 以 通过 观察 图 表 上 的 “随机 ”条 的 高 度 ， 来 





判断 真正 的 随机 选择 选项 的 随机 性 。“ 评 级 人 1 








的 每 一 步 移动 是 否 有 相同 的 上 升 高 度 来 判断 。 


























级 歌曲 12%~27% 的 选择 几率 似乎 是 线性 的 。 从 5 星 评 





避 加 倍 





高 差 ” 条 的 线性 性 质 ， 可 以 通过 分 析 从 1 星 级 到 5 星 级 
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图 5-2: 歌曲 选择 模式 


5.5.2 ”计算 选择 过 程 的 统计 量 
改变 每 个 评级 内 歌曲 的 数目 会 改变 每 首 歌曲 被 选中 的 概率 。 因 为 每 个 评级 里 都 有 多 首 歌曲 ， 
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一 首 被 评 为 的 歌曲 在 下 一 次 评级 偏好 的 (ratings-biased ) 派对 随机 播放 中 出 现 的 几率 ,可 用 如 下 
表达 式 计算 : 


3 


7 


(2 已) | (xDP) | (x,B) | (xB) | (2P) | (2 局) 
这 个 表达 式 中 的 下 标 表示 歌曲 的 评级 。 一 首 歌曲 被 选中 的 几率 取决 于 x ( 每 个 等 级 的 歌曲 数 ) 
和 P (iTunes 算 法 给 的 每 个 评级 的 百分比 权重 )。 
每 类 评级 的 iTunes 偏 好 概率 ， 取 自 一 个 周末 的 抽样 ， 下 面 是 结果 表达 式 : 


太 忆 
0.0388xu 十 0.11802 +0.1536x, 十 0.1893x3 +0.2299x, +0.2703x; 


虽然 评级 较 高 的 歌曲 会 优先 考虑 ， 但 相 比 其 他 所 有 的 歌曲 ， 你 不 一 定 会 听 到 更 多 的 5 星 评级 
歌曲 。 我 们 假设 ， 多数 人 评级 的 时 候 遵 循 正 态 分 布 [Hack #23]， 其 中 3 星 级 最 常见 。 表 5-9 显 示 一 
个 假设 的 、 评 级 歌曲 计数 为 钟 形 曲 线 的 iTunes 资 料 库 。 























表 5-9: 型 的 歌曲 评级 分 布 





歌曲 评级 歌曲 数量 
没有 评级 72 

1 321 

2 1527 

3 1812 

4 507 

5 95 


如 果 用 我 们 的 频率 方程 运行 这 些 假设 的 数字 ， 会 得 到 如 图 5-3 所 示 的 分 布 。 











0.50 
0.45 -|[ | 随机 

0.40 下 图 评级 偏差 
0.35 
0.30 
0.25 
0.20 


0.15 
0.10 

0.05 

0001 a 


图 5-3: 歌曲 选择 的 概率 分 布 












































播放 下 首 的 概率 
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正如 你 在 图 5-3 中 看 到 的 那样 ， 有 特定 评级 的 一 首 歌 在 播放 列表 中 下 一 个 出 现 的 几率 很 大 程 
度 是 由 该 歌曲 评级 内 的 歌曲 数量 决定 的 。iTunes 对 高 评级 歌曲 的 偏好 ， 以 及 对 低 评 级 歌曲 的 厌恶 
只 是 略微 提高 或 降低 了 由 歌曲 数量 决定 的 概率 。 

可 以 将 听 到 具有 某 个 评级 歌曲 的 几率 运用 到 计算 听 到 一 首 特定 歌曲 的 几率 。 如 果 我 们 在 歌曲 
选择 表达 式 的 分 母 里 拿 掉 歌曲 数量 , 我 们 就 可 以 计算 下 一 首 是 某 首 特定 歌曲 的 几率 , 而 不 是 下 一 
首 是 某 一 评级 歌曲 的 几率 : 























区 六 


rr 
| 


(WRITXP)TB) tNB)+ (GDB) + (rR) 








5.5.3 解释 统计 惊喜 


运行 这 些 测试 后 大 约 一 个 月 ， 我 工作 时 发 现 我 的 iTunes 派 对 随机 播放 时 对 同一 首 歌 连续 播放 
了 两 次 。 这 是 我 第 一 次 注意 到 一 个 连续 的 重复 ， 然 后 我 检查 了 播放 列表 。 我 不 仅 发 现 Nirvana 的 
7erritorial Pissings 在 列表 上 连续 出 现 两 次 ,而 且 A.F.I 的 Dea 太 ojseasons 在 三 次 音 轨 后 连续 出 现 了 
两 次 。 

我 用 的 是 “ 较 多 播放 评级 较 高 的 歌曲” 这 一 选项 ， 但 这 些 都 是 中 庸 的 3 星 级 歌曲 ， 我 的 歌曲 
库 拥 有 近 4000 首 歌 。 初 看 概率 似乎 令 人 惊讶 ,但 你 必须 意识 到 你 在 一 个 工作 日 能 听 多 少 首 歌 。 如 
果 我 平均 每 天 工作 10 小 时 ， 而 平均 一 首 歌曲 的 播放 时 间 是 3.5 分 钟 ， 概 率 认为 我 应 该 在 不 到 一 个 
月 的 时 间 内 听 完 一 个 连贯 的 重复 。 

很 多 人 声称 当 iTunes 在 漫步 他 们 的 音乐 集 时 仍然 可 以 看 到 模式 (pattern ), 但 这 些 模式 大 多 数 
都 只 是 同一 个 艺术 家 的 多 首 歌曲 。 这么 想 想 : 如 果 你 有 2000 首 歌曲 ，40 首 来 自 同 一 个 艺术 家 ， 随 
机 播放 时 总 是 有 大 约 2% 的 几率 会 再 次 听 到 这 些 歌 。 一 首 歌 播放 完 后 ， 同 一 个 艺术 家 的 歌曲 在 下 
35 首 歌 再 次 播放 的 几率 是 50%， 在 下 50 首 歌会 再 次 播放 的 几率 是 64%。 这 可 以 通过 下 面 这 个 公式 


来 计算 : 
Xx ™— 
Pl(n) 4 1 -| total artist | 
Xtotal 


正如 我 们 在 其 他 Hack 里 看 到 的 一 样 ， 小 概率 事件 〈 比如 我 们 有 2% 的 几率 能 重复 听 到 某 位 艺 
术 家 的 歌曲 ) 只 需要 一 些 机 会 [Hack #46] 就 会 变 成 一 个 极 有 可 能 的 事件 。 


我 们 会 潜意识 的 找到 一 个 模式 ， 让 你 觉得 iTunes 有 一 个 偏好 。 















































5.5.4 ”参阅 
有 关 iPod 和 洗 牌 的 更 多 技术 信息 可 以 在 下 列 资料 中 找到 : 
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口 Levy, Steven. “Does Your iPod Play Favorites.” January 31, 2005. http://msnbc.msn.conyid/ 
6854309/site/newsweek/。 
口 Hofferth,Jerrod.“ UsingPartyShuffleiniTunes.” August22,2004.http://ipodlounge.com/index.php/ 





articles/comments/using-party-shuffle-in-itunes/. 


一 一 布雷 恩 . 汉 森 


和 5.6 预测 比赛 冠军 
55 储 助 提供 的 相关 信息 ,我 们 有 可 能 预测 住 何 结果 ， 尤 其 是 体育 领域 的 结果 。 有 了 多 元 
回归 技术 和 一 个 小 软件 , 你 就 可 以 在 比赛 开始 前 猜测 谁 是 赢家 。 决 窒 在 于 选 振 正 确 约 
预测 变量 。 
对 相关 性 [Hack #11] 的 常见 用 法 是 找 出 两 个 变量 共享 信息 的 程度 ， 或 者 更 专业 点 ， 是 两 个 变 
量 之 间 方 差 的 共享 程度 。 





共享 方差 是 一 个 数学 术语 ， 用 来 描述 两 个 变量 反映 的 宛 余 信息 量 。 当 大 量 的 方差 被 
共享 时 ， 预 测 是 容易 且 准 确 的 ， 因 为 对 一 个 变量 的 认 知 就 能 导致 对 第 二 个 变量 的 认 
知 。 共 享 方差 通过 对 相关 性 进行 平方 来 估计 。 





但 是 ,我 们 的 日 常 世界 不 止 由 单一 变量 预测 另 一 个 变量 组 成 。 事 实 上 , 在 大 多 数 情 况 下 , 用 
于 预测 特定 结果 的 变量 存在 几 个 或 多 个 。 在 这 里 ， 我 们 不 处 理 单一 变量 对 另外 一 个 变量 的 预测 ， 
而 是 处 理 多 个 变量 对 一 个 变量 的 预测 。 这 种 工具 称 为 多 元 回归 〈 因 为 有 多 个 预测 变量 )。 

资深 的 体育 赌 徒 、 博 彩 公 司 和 赌场 运营 者 都 熟悉 多 元 回归 ， 或 者 至 少 他 们 应 该 熟悉 。 有 如 此 
多 的 关于 体育 队伍 的 信息 ， 以 至 于 我 们 几乎 能 确定 所 有 的 变量 ,按照 正确 的 组 合 方式 ,我 们 就 可 
以 相当 准确 地 预测 哪 支 球 队 会 获胜 。 

投注 职业 足球 是 所 有 的 赌博 行为 (至 少 我 听 到 的 是 这 样 ) 中 最 常见 的 一 种 。 这 个 技巧 展示 了 
如 何 收集 数据 , 并 使 用 多 元 回归 预测 足球 赛 的 冠军 。 本 例 预 测 的 是 谁 会 赢得 超级 杯 一 一 全 国足 球 
联赛 的 冠军 。 


























5.6.1 选择 预测 变量 


第 一 步 是 构建 模型 〈 预测 因子 及 其 权重 ,你 会 用 它们 来 进行 预测 )。 对 于 足球 ， 有 很 多 关于 
球 队 过 往 成 绩 和 球员 特点 的 保存 资料 和 统计 数据 。 有 些 用 来 预测 未 来 表现 ( 例如 ,过 往 成 绩 ) 是 
合理 的 ， 而 有 些 则 不 合理 ( 例如， 吉祥 物 的 可 爱 度 )。 但 是 ， 赢 钱 的 机 会 ， 是 一 个 强大 的 动力 ， 
所 以 我 会 花 时 间 和 精力 来 收集 所 有 我 能 收集 到 的 关于 每 支 球 队 和 每 一 场 比赛 的 统计 资料 。 关键 是 
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找到 与 万 得 超级 杯 非常 相关 的 变量 。 

我 们 假设 你 已 经 做 完了 相关 研究 ， 发 现 有 6 个 变量 与 球 队 输 赢 有 关 。 有 些 变量 是 合理 的 ， 有 
不 是 合理 的 。 你 对 获得 最 准确 的 真实 生活 预测 感 兴 趣 ， 所 以 甚至 愿意 将 厨房 水 槽 包含 进去 ， 如 
果 它 起 作用 的 话 。 说 明确 点 , 你 记录 特定 一 支 球 队 出 现在 超级 杯 中 的 年 份 , 然后 收集 从 那 年 起 那 
支 球 队 的 数据 。 

想象 一 下 ,你 已 经 发 现 , 依据 往年 成 绩 和 30 支 球 队 的 特征 ， 以 下 你 感 兴 趣 的 变量 可 能 在 结果 
预测 上 是 有 用 的 。 你 在 模型 中 使 用 的 变量 ， 以 感 兴趣 的 结果 开始 ， 也 就 是 ， 在 数据 收集 的 那 年 球 
队 是 否 赢得 超级 杯 ( 是 =1， 否 =2 ) ? 
你 发 现下 面 的 变量 和 结果 相关 : 
口 赛季 期 间 轻 松 获胜 的 数量 ( 超过 9 分 ); 
口 本 赛季 的 平均 出 场 数 ; 
口 每 场 出 售 热狗 的 平均 数 ; 
口 团队 佳 得 乐 饮料 的 平均 温度 ; 
口 防守 线 球员 的 平均 体重 。 
当 你 以 真实 的 数据 进行 分 析 时 ， 你 可 能 会 发 现 不 同 的 潜在 预测 搭配 。 
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5.6.2 ”将 数据 输入 电子 表格 


社会 科学 家 经 常 使 用 统计 软件 ， 如 SPSS 或 SAS， 但 在 这 个 例子 中 ， 我 使 用 Excel 工 作 表 以 及 
Excel 非 常 酷 的 数据 分 析 工 具 包 ( 和 回归 工具 ) 我 输入 了 一 些 虚构 但 符合 实际 的 数据 到 表 5-10 所 
示 的 电子 表格 中 。 





ee 
示 如 何 制 作 你 自己 的 预测 公式 。 我 会 自己 留 着 的 ， 非 常 感谢 你 ! 


表 5-10: 超级 杯 预测 变量 





队伍 是 否 赢得 超级 杯 轻松 获胜 次 数 出 场 数 热狗 数 佳 得 乐 体重 
A 1 11 56 533 4798 56 276 
B 2 9 44 543 5715 76 311 
C 1 8 45 543 9753 45 315 
D 1 6 45 768 8020 46 311 
E 1 8 76 786 5395 56 256 
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( 续 ) 
队伍 是 否 赢得 超级 杯 。 ”轻松 获胜 次 数 。” ”出 场 数 热狗 数 佳 得 乐 体重 
F 1 11 56 533 1054 67 277 
G 2 9 56 554 750 76 256 
H 2 12 44 675 6576 77 254 
I 2 11 56 667 9187 77 287 
J 2 10 65 545 4533 87 301 
K 2 12 78 756 1963 86 243 


表 5-10 显 示 了 我 收集 的 虚构 的 30 行 数据 的 一 部 分 , 30 行 数据 代表 我 统计 分 析 中 用 到 的 30 个 例 
子 。 数 据 的 行 数 越 多 ， 你 可 以 获取 的 例子 越 多 ， 最 终 的 预测 也 会 越 准确 。 
5.6.3 ”建立 回归 方程 

你 或 许 还 记得 高 中 时 代 的 一 个 公式 ， 简 单 的 直线 公式 看 起 来 像 这 样 : 


Y=bX+a 





这 个 方程 由 以 下 变量 组 成 : 

Y 变量 Y 上 的 预测 分 数 

bp ”该 直线 的 斜率 

了 分 数 的 单一 预测 源 

a 截 距 ( 直线 穿越 Y 或 垂直 轴 的 地 方 ) 

因此 ， 举 例 来 说 ， 如 果 你 想 用 体重 预测 人 类 的 高 度 ， 可 以 通过 一 组 数据 得 出 各 个 值 ， 然 后 创 
建 公 式 ， 你 可 能 会 得 到 看 起 来 像 这 样 的 东西 : 

Y=35X+20.3 

这 意味 着 ， 如 果 你 的 体重 (X 变 量 ) 是 125 英 镑 ， 预 测 结果 就 是 你 大 约 高 64 英 寸 ， 或 大 约 高 
英尺 3 英寸 。 

但 是 ， 当 我 们 有 多 个 预测 变量 时 , 事情 变 得 更 有 趣 了 。 我 们 有 了 一 个 较 长 的 系列 预测 ( 多 个 
六 ) 和 权重 ( 多 个 5b )。 


我 在 SPSS 统 计 软件 里 使 用 该 数据 运行 多 元 回归 分 析 ， 你 也 可 以 使 用 Excel 得 到 大 部 分 相同 的 
言 息 〈 见 补充 内 容 “ 在 Excel 中 获得 回归 信息 ”)。 
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在 Excel 中 获得 回归 信息 


有 两 种 方法 可 使 用 Excel 来 获得 统计 回归 信息 。 首 先 ， 你 可 以 使 用 SLOPE 和 INTERCEPT 函 
数 ， 你 可 以 从 Insert-Function 找 到 。 选 择 函 数 并 输入 参数 (数据 所 在 的 单元 格 )，Excel 返 回 这 些 
值 ， 它 允许 你 插入 已 知 的 值 并 预测 其 他 的 值 。 此 方法 在 只 有 一 个 预测 变量 时 效果 最 好 。 

你 也 可 以 使 用 数据 分 析 工 具 库 中 的 Regression 选 项 ， 这 是 一 个 Excel 加 载 项 (你 可 能 需要 安 
装 )。 使 用 工具 菜单 上 的 这 个 选项 时 ,你 可 以 采用 F 检 验 测试 回归 系数 的 显著 性 ,，F 检 验 类 似 于 
t 统 计 检 验 [Hack #17]。 


结果 ( 即 输 出 ) 如 表 5-11 和 表 5-12 所 示 。 让 我 们 看 看 哪个 变量 能 最 好 地 协助 我 们 预测 一 支 球 
队 是 否 会 说 得 超级 杯 。 

















表 5-11: 回归 统计 
多 元 R R? 观察 量 
0.8483 0.7196 30 





表 5-12: 回归 方程 








变量 系数 t 统 计 值 P 值 

截 距 —0.784 -1.010 0.323 
轻松 获胜 0.119 4.274 0.000 
出 场 0.000 -0.822 0.416 
卖 出 热狗 0.000 1.043 0.308 
佳 得 乐 0.013 2.457 0.022 








体重 0.001 0.580 0.567 
表 5-12 显 示 了 方程 的 5 个 变量 的 系数 ( 权重 )， 用 于 表示 每 一 个 预测 超级 杯 说 家 的 变量 的 表现 
情况 。 例 如 ， 和 “轻松 获胜 ”这 一 变量 的 相关 系数 是 0.119。 
如 果 我 们 将 所 有 这 些 信 息 结合 进 一 个 大 的 方程 来 预测 超级 杯 的 结果 ， 能 得 到 如 下 模型 ; 
六 = bY, Tb TB +bY,+bY, +a 
所 以 ， 每 一 个 预测 变量 ( 从 XY 到 X，) 都 有 对 应 的 具体 权重 ( 式 中 的 2 或 结果 中 的 系数 )。 
现在 ， 把 单词 代入 相同 的 公式 : 
bx 获胜 +b x 平均 出 场 +b x 热狗 +b x 温度 +b x 体重 +a 
使 用 表 5-12 所 示 输 出 的 数据 ， 下 面 是 真正 的 实况 回归 方程 : 
Y'=0.119X, +0.000X, +0.000X, +0.013X, +0.001X, +a 




















曙 
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5.6.4 ”解释 和 运用 回归 方程 


试想 一 下 , 对 所 有 输入 到 电子 表格 中 的 行 数据 使 用 这 个 方程 。 超级 杯 的 实际 结果 和 预测 结 
有 相当 高 的 相关 性 。 我 知道 这 是 因为 表 5-11 显 示 输 出 的 “多 元 R” 部 分 ， 显示 了 相当 高 的 相关 性 。 
0.84 接 近 于 1， 这 是 你 能 得 到 的 最 高 的 相关 。 























刀 “R2” 为 0.72， 这 就 是 我 们 之 前 读 到 的 共享 方差 的 比例 。 


























这 是 什么 意思 ? 这 些 预测 变量 的 组 合 是 判断 一 支 球 队 是 否 会 赢得 超级 杯 的 相当 有 效 的 方法 。 
万 无 一 失 吗 ? 当然 不 是 , 因为 这 些 组 pi endi 但 它 确实 做 了 一 个 非常 扎实 
的 工作 。 

那么 ， 举 例 说 今年 Denver Cannonball 的 数据 点 如 表 5-13 所 示 。 








表 5-13: Denver Cannonball 数 据 





变量 什 
轻松 获胜 13 

出 场 数 35 678 
热狗 4567 
佳 得 乐 65 
体重 267 








将 这 些 数 据 插入 前 面 所 示 的 公式 ， 下 面 就 是 我 们 得 到 的 关于 7 的 预测 : 
Y=0.119(13)+0.000(35678)+0.000(4567) 
+0.013(65)+0.001(267)-0.784 

7 的 最 终 值 是 1.875， 更 接近 2 ( 意味 着 没有 预测 出 他 们 会 夺冠 ) 而 不 是 1 ( 意味 着 他 们 预计 将 
获胜 )。 

一 套 好 的 预测 指标 有 哪些 关键 点 ? 
口 所 有 的 预测 都 应 该 是 相互 独立 的 (如果 可 能 的 话 要 完全 独立 )， 因 为 你 希望 在 对 预测 的 理 
解 上 ， 它 们 能 提供 独特 的 贡献 。 
口 每 个 预测 变量 应 该 尽 可 能 高 地 和 你 预测 的 结果 相关 。 

















5.6.5 ”改进 你 的 回归 方程 


仔细 研究 这 个 Hack 产 生 的 方程 , 可 发 现 大 部 分 的 预测 能 力 只 来 自 于 两 个 变量 : 轻松 获胜 的 数 
量 和 球 队 的 佳 得 乐 温度 。 另 外 , 许多 预测 变量 的 权重 为 零 ,这 意味 着 你 不 需要 它们 。 你 可 以 删除 
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这 些 无 用 的 变量 ( 出 场 数 和 出 售 的 热狗 数 ) 以 简化 你 的 公式 。 事实 上 ， 只 收集 轻松 获胜 数 和 佳 得 
乐 温度 数据 就 足以 在 我 们 的 例子 中 作出 相当 准确 的 预测 。 


打开 你 的 收音 机 ， 停 在 桥 球 比赛 电台 5 秒 钟 ,然后 将 其 关闭 。 不 需要 听 到 分 数 ， 你 就 
可 以 说 出 获胜 的 一 方 ， 你 有 超过 一 半 的 次 数 是 对 的 。 


你 看 , 我 是 个 大 忙 人 。 我 一 直 在 寻找 一 种 方式 节省 花 在 生活 中 不 太 重 要 的 事情 上 的 时 间 ， 比 
如 追随 我 喜爱 的 本 地 棒球 队 ， 这 样 我 就 有 更 多 的 时 间 花 在 生活 中 重要 的 事情 上 : 朋友 、 家 庭 、 讨 
论 Holm's sequential Bonferroni 访 法 "作为 方差 分 析 的 合适 补充 方法 ， 等 等 。 一 个 典型 的 例子 就 发 
生 在 几 天 前 。 我 想 知道 堪萨斯 城 皇家 队 是 否 会 赢得 一 场 正 在 进行 的 棒球 比赛 , 但 我 几乎 没有 时 间 
等 到 比赛 结束 。 我 现在 就 想 知道 结果 ! 


和 5.7 预测 棒球 比赛 的 胜 负 
1 卫 预 7 























就 像 维 重卡. 索 尔 特 4 和 她 对 拥有 一 个 威 利 . 上 旺 卡 工厂 里 的 奥 圳 伦 伯 人 6 的 兴趣 一 
样 , “就 现在 !”， 我 没有 太 多 的 耐心 。 


就 像 一 个 晴天 霹雳 ,我 意识 到 , 我 可 以 打开 车 上 的 收音 机 ， 只 需 短 短 几 秒 钟 ， 我 就 能 有 足够 
的 信息 来 猜测 比赛 结果 。 我 能 做 到 这 一 点 ， 且 不 需要 听 得 分 情况 或 谁 在 垒 上。 





5.7.1 如何 生效 


在 棒球 比赛 开始 后 的 几 个 小 时 内 , 打开 那 场 比赛 的 广播 。 收听 时 长 能 刚好 确认 哪个 球 队 在 击 
球 即 可 。 那 支 球 队 有 大 于 50% 的 几率 赢得 比赛 。 


5.7.2 ”生效 原理 


棒球 是 这 样 一 种 比赛 : 你 进攻 的 时 间 越 长 ， 你 能 获得 的 分 数 越 多 。 随 着 一 局 中 出 现 越 来 越 多 
的 击 球员 , 沿 着 爸 径 跑 动 的 击 跑 员 和 穿 过 本 垒 板 的 几率 增加 。 另 一 种 看 待 它 的 方式 是 ,想象 一 局 
比赛 快 结束 时 ， 某 支队 伍 获 得 了 很 高 的 得 分 。 如 果 这 个 球 队 得 分 很 多 ,他们 必定 已 经 使 用 了 比 那 
局 规定 最 少 的 3 个 击 球员 更 多 的 击 球员 ， 因 此 ,在 又 上 的 时 间 比 其 他 的 球 队 要 长 ， 长 出 的 时 间 和 
队员 数 成 比例 。 比 赛 过 程 中 ,在 又 上 时 间 最 长 的 球 队 更 容易 得 分 多 ( 或 有 更 多 的 成 果 显著 的 赛 局 )。 











注 3: Holm's sequential Bonferron 访 法 是 在 统计 学 中 用 来 控制 型 错误 的 方法 。 一 一 译 者 注 
注 4: Veruca Salt,《 查 理 和 巧克力 工厂 》 中 的 人 物 。 一 一 译 者 注 

注 5; Willy Wonka， 是 《查理 和 巧克力 工厂 》 里 的 一 名 虚拟 角色 。 译 者 注 
注 6: Oompa-Loompas， 奥 古 伦 伯 的 本 地 人 ， 作 为 工厂 中 的 小 矮人 工人 ， 他 们 表演 了 一 场 义 一 场 精 彩 的 舞台 剧 。 一 一 译 者 注 
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抽样 理论 [Hack #19] 表 明 ， 样 本 最 有 可 能 捕捉 总 体 中 最 常见 的 元 素 。 在 这 里 我 们 的 总 体 是 一 
场 比 赛 中 我 们 能 听 到 的 所 有 时 刻 。 总 体 中 最 常见 的 特征 (用 “ 谁 在 又 上 ”表示 ) 属于 在 又 上 时 间 
最 长 的 球 队 。 

图 5-4 显 示 出 常规 9 局 比赛 的 垒 上 时 间 的 可 能 分 布 。 在 这 个 例子 中 ， 获 胜 的 球 队 有 58% 的 
时 间 处 于 进攻 状态 。 现 在 回想 起 来 ， 随 机 找 个 时 间 打 开 广 播 ， 有 58% 的 几率 发 现 获胜 的 球 队 在 
全 上 。 



































全 
局 
1 








| 

| 
获胜 球 队 | 
失败 球 队 | | | | 
回 在 又 上 的 时 间 比例 











-| 





































































































图 5-4: 输赢 球 队 的 垒 上 时 间 


从 长 远 来 看 , 利用 棒球 广播 节目 信息 预测 比赛 结果 的 准确 度 应 高 于 50%, 但 不 一 定 真 的 很 准 。 
这 是 因为 在 又 上 的 时 间 和 进 球 获胜 之 间 的 关系 不 是 一 个 完美 的 相关 [Hack #11]。 球 员 可 以 得 分 快 
点 ， 比 如 , 在 他 们 的 第 一 球 击 中 一 个 本 又 打 ; 或 者 他 们 可 以 花 自 己 的 时 间 获 得 很 多 击 打 次 数 , 但 
困 住 了 很 多 击 跑 员 ， 从 不 得 分 。 

但 是 ， 总 体 上 ， 两 个 变量 之 间 的 相关 性 应 是 正 的 。 即 便 图 $-4 中 我 想象 的 数据 可 能 仅 有 58% 
的 准确 率 , 但 这 也 比 你 盲目 猜测 的 准确 率 高 出 16%。 如 果 在 21 点 牌 桌 边 有 这 样 一 个 优势 ， 你 会 在 
一 个 星期 内 变 成 百 万 富翁 。 





























5.7.3 证明 有 效 性 


为 了 测试 我 观点 的 正确 性 , 你 可 以 使 用 日 报 上 出 现 的 数据 。 虽 然 大 多 数 比赛 记录 表 没有 每 文 
球 队 人 又 上 总 时 间 这 一 信息 , 但 有 一 个 变量 提供 了 几乎 相同 的 信息 。 记 录 表 肯定 会 报告 一 个 “总 爸 
上 数 ”(total at-bats )。 虽 然 这 个 统计 量 和 又 上 时 间 不 一 样 ， 但 它们 之 间 应 该 有 相当 高 的 相关 性 。 
每 一 天 都 会 提供 十 几 场 比赛 的 这 个 信息 , 短 短 几 天 的 有 价值 的 数据 应 该 足以 检验 我 的 理论 。 收集 
每 支 球 队 的 总 又 上 数 ， 包 括 哪 支 球 队 赢得 了 比赛 。 

















现实 生活 中 的 研究 人 员 往 往 无 法 获得 他 们 真正 想 知道 的 变量 ,我 们 使 用 笃 上 数量 代 
BR 替 忽 上 时 间 就 是 一 个 很 好 的 例子 。 相 反 ， 我 们 必须 选择 另 一 个 可 用 的 最 好 的 变量 。 
科学 家 们 称 这 些 替 代 品 为 代理 变量 或 替代 变量 。 





我 的 假设 是 ， 垒 上 数 最 多 的 球 队 ， 赢 得 比赛 的 几率 大 于 50%。 出 于 好 奇 ， 我 测试 了 自己 的 这 
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个 假设 ,我 用 芝加哥 小 能 队 作为 例子 ,因为 他 们 的 统计 资料 在 网 上 都 是 现成 的 ,我 随机 选取 了 2003 
年 小 能 队 最 初 的 25 场 比赛 。 通 过 对 这 样 比赛 的 分 析 发 现 ， 人 又 上 数 最 多 的 球 队 ， 主 的 几率 为 56%。 
如 果 我 消除 在 又 上 平局 的 3 种 情况 ， 我 预测 的 准确 度 就 有 63%。 虽 然 垒 上 数 最 少 的 球 队 ， 有 时 也 
会 战胜 芝加哥 小 熊 队 , 但 又 上 数 的 差距 越 大 ,人 垒 上 数 最 多 的 球 队 越 有 可 能 赢 。 当 又 上 数 最 多 的 球 
队 获 胜 时 ， 他 们 平均 比 输 掉 的 球 队 公 上 数 多 出 4.14。 当 人 又 上 数 最 少 的 球 队 获胜 时 ， 他 们 平均 只 比 
输 掉 的 球 队 爹 上 数 多 出 2.88。 








5.7.4 其 他 生效 领域 


有 人 建议 ， 当 我 支持 的 堪萨斯 城 皇 家 队 参 赛 时 ， 如 果 我 想 超过 一 半 的 时 间 是 正确 的 ,我 应 该 
总 是 预测 他 们 输 掉 。 是 的 ， 是 的 ， 这 很 搞笑 。 



































5.7.5 ”无 效 领域 


我 建议 你 在 赛程 的 前 几 个 小 时 尝试 , 因为 如 果 你 在 第 九 局 打开 收音 机 , 那么 这 个 方法 的 准确 
度 会 变 低 ， 根 据 棒球 规则 ， 如 果 主 场 队 在 第 九 局 前 处 于 领先 ， 他 们 就 不 用 击 球 。 他 们 说 了 。 比 赛 
结束 。 因 为 主场 队 往 往 比 客场 队 启 得 更 多 ， 这 意味 着 获胜 的 球 队 常 常 在 第 九 局 从 不 击 球 。 

这 就 提出 了 这 种 预测 方法 的 一 个 有 趣 的 变化 ,只 适用 于 第 九 局 。 比 赛 进行 到 第 九 局 时 打开 广 
播 ， 如果 你 支持 的 球 队 正在 击 球 , 或 许 这 并 不 是 一 件 好 事 。 芝加哥 小 能 队 的 数据 显示 ， 获 胜 的 球 
队 偶尔 比 他 们 的 对 手 有 更 少 的 垒 上 数 , 这 可 以 通过 这 样 的 事实 来 进行 部 分 解释 : 获胜 的 球 队 有 时 
只 在 前 八 局 里 击 球 。 

这 种 方法 并 不 适用 于 所 有 的 体育 运动 。 例 如 , 在 篮球 比赛 中 ， 人 们 不 认为 持 球 时 间 和 得 分 正 
相关 ,在 激烈 比赛 中 , 快速 进 球 的 球 队 甚至 导致 相关 性 为 负 。 另 一 方面 ,在 足球 场 上 ， 持 球 时 间 
被 认为 是 一 个 关键 的 能 力 表现 指标 ， 通 常 和 胜利 相关 。 

















使 用 Microsoft Excel 来 绘制 数据 分 布 ， 可 以 让 你 对 储 计数 据 有 一 个 更 好 的 理解 。 


i 5 在 Excel 中 绘制 直方 图 
#57 








俗话 说 “一 图 胜 千 言 。 这 有 一 定 的 道理 。 一 幅 图 往往 是 理解 1000 个 数字 的 最 好 方式 。 人 
是 视觉 导向 的 。 我 们 善于 看 一 张 图 片 并 观察 不 同 的 特征 ， 不 善于 看 有 1000 个 数字 的 列表 。 

直方 图 是 帮助 我 们 理解 数据 的 一 种 最 有 力 的 工具 , 它 是 关于 值 分 布 的 图 。 下 面 是 直方 图 的 概 
念 。 假设 你 有 很 多 数据 ， 比 方 说 ，1955 年 至 2004 年 间 ， 所 有 6032 名 每 场 比 赛 中 安打 数 为 3.1 及 以 
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上 的 棒球 选手 的 安打 率 "。 我 们 同时 假定 ， 你 想 知 道 这 些 值 是 如 何 分 布 的 。 最 低 值 是 多 少 ， 最 高 
值 是 多 少 ? 低 的 值 是 否 比 高 的 值 更 多 ? 安打 率 是 完全 介 于 0~0.400 的 随机 数 ， 还 是 存在 某 种 模 
式 ? 

安打 率 可 以 有 许多 不 同 的 值 。1955 年 到 2004 年 ，6032 名 球员 有 合格 的 安打 率 ， 有 1229 个 独特 
的 值 。 您 可 以 绘制 每 个 独特 安打 率 下 的 球员 数 (虽然 我 无 法 想象 这 个 图 是 什么 样子 )。 但 我 们 并 
不 真正 关心 每 一 个 独特 的 值 ， 例 如 ，13 名 球员 有 0.2 862 的 安打 率 不 是 那么 有 趣 。 相 反 ， 我 们 可 能 
会 想 知 道 有 非常 相似 安打 率 的 球员 数量 ， 比 如 说 安打 率 在 0.285~0.290 的 球员 数量 是 多 少 。 

让 我 们 把 每 个 范围 想象 成 一 个 桶 。 每 个 赛季 球员 进入 一 个 桶 里 。 例 如 ，1959 年 ， 汉 克 “' 亚 纶 
(Hank Aaron ) 有 0.354 的 安打 率 ， 所 以 我 们 会 把 这 个 赛季 放 在 0.350~0.355 的 桶 里 。 所 以 ， 下 面 是 
我 们 的 方案 : 我 们 把 每 个 赛季 球员 放 到 一 个 桶 里 , 计算 每 个 桶 里 赛季 球员 的 数量 ,并 绘制 图 形 展 
示 ( 按 升序 排列 ) 每 个 桶 里 球员 的 数量 。 这 个 图 就 是 直方 图 。 



























































5.8.1 代码 


在 这 个 例子 中 , 我 想 看 看 安打 率 的 分 布 。 我 用 了 包含 每 个 球员 每 年 总 的 安打 统计 的 表格 (以 
及 每 个 球员 所 在 的 球 队 名 单 )， 还 有 我 称 为 b_and_t 的 表格 。 我 只 选择 了 1955 年 至 2004 年 间 ， 获 得 
足够 打 席 数 够 格 成 为 联赛 冠军 的 球员 : 

SELECT b.playerID ，M.nameLast , M.nameFirst , b.yearID , b.teamG ， 

b.teamIDs , b.AB ，b.H ， 

b.H/ b.AB AS AVG， 

b.AB + b.BB + b.HBP + b.SF as PA 

FROM b_ and t inner join Master M 

on b.playerID = m.playerID 


WHERE yearID > 1954 
AND b.AB + b.BB + b.HBP + b.SF > b.teamG * 3.1 ; 


运行 此 查询 后 ， 我 把 结果 保存 为 Excel 文 件 ， 名 为 batting averages.xls。 


在 Excel 中 绘制 直方 图 的 一 种 方法 是 使 用 分 析 工 具 库 ( Analysis ToolPak ) 的 加 载 项 。 你 可 以 
从 Tools 荣 单 通过 选择 Add…Ins 来 添加 ， 然 后 选择 分 析 工 具 库 (Analysis ToolPak )。 这 给 Tools 菜 单 
增加 了 一 个 新 的 菜单 项 ， 叫 数据 分 析 。 它 引入 了 一 些 新 功能 ,包括 直方 图 这 个 功能 。 但 我 觉得 这 
个 界面 混乱 而 且 缺 乏 灵活 性 ， 所 以 我 用 了 别 的 方法 。 

下 面 是 我 创建 直方 图 的 方法 。 

(1) 在 工作 表 的 数据 中 ， 创 建 一 个 新 的 名 为 Range 的 列 。 

































































注 7: 在 棒球 运动 中 ， 安 打 表 示 击 球 手 把 投手 投 出 来 的 球 击 出 到 界 内 ， 使 打者 本 身 能 至 少 安全 上 到 一 盆 的 情形 。 
一 一 译 者 注 
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(2) 在 本 列 的 第 一 个 单元 格 ， 对 你 希望 为 其 绘制 分 布 的 值 使 用 函数 进行 四 舍 五 人 。 做 到 这 一 
点 最 简单 的 方法 来 是 使 用 ROUND 函 数 的 有 效 数字 选项 。 在 我 的 工作 表 中 ， 列 I 包含 了 我 想 计算 分 布 
的 值 (安打 率 )， 所 以 我 可 以 用 一 个 公式 ， 比 如 ROUND(I2,2) 来 四 舍 五 入 到 最 接近 0.010。 就 个 人 而 
言 , 我 发 现 0.005 大 小 的 桶 更 具 描述 性 , 所 以 我 用 了 一 个 技巧 。 你 可 以 在 ROUND 函数 里 乘 以 一 个 值 ， 
然后 在 函数 外 除 以 一 个 值 ， 这 样 可 以 得 到 几乎 任何 大 小 的 桶 。 在 ROUND 函数 里 ， 我 乘 以 桶 大 小 的 
倒数 一 一 这 种 情况 下 ， 是 1/0.005=200。 子 数 外 面 ， 我 乘 以 桶 的 大 小 。 在 我 的 工作 表 中 ， 列 I 包含 
了 平均 值 。 于是, 我 用 ROUND(I2*200,0)/200 作 为 我 的 公式 。 将 此 公式 复制 粘贴 到 工作 表 中 的 每 一 
行 。( 你 可 通过 双击 单元 格 的 右 下 角 ， 快 速 快 做 到 这 一 点 。) 

(3) 现在 ， 我 们 已 经 准备 好 计算 每 个 桶 中 玩家 的 数量 了 。 选 择 工 作 表 的 所 有 数据 ， 包 括 新 的 
Range 列 。 从 Data 菜 单 中 选择 数据 透视 表 和 数据 透视 图 表 报 告 。 选 择 数 据 透 视图 报表 ， 然 后 单 击 
Finish ( 我 们 将 使 用 所 有 的 默认 值 )。 我 们 将 为 我 们 的 数据 透视 表 选 择 两 个 区 域 。 从 数据 透视 表 字 
段 列 表面 板 中 ， 选 择 Range。 将 这 个 拖 放 到 数据 透视 表 的 Drop Row Fields Here 部 分 。 接 下 来 ， 拖 
放 “playerID” 到 数据 透视 表 的 Drop Data Item Here 部 分 。 默 认 情 况 下 ，Excel 将 计算 匹配 每 个 范 
围 值 的 球员 ID 数 。 数 据 透视 表现 在 显示 了 每 个 桶 中 的 项 目 数 。 你 应 该 看 到 一 张 〈 非常 难看 关于 ) 
的 每 个 桶 中 球员 数量 的 图 。 

(4) 清理 美化 图 表 。( 我 喜欢 控 除 背景 填充 和 线条 ， 改 变 列 宽 。) 图 5-5 的 例子 即 为 一 张 清理 干 
净 后 的 图 表 。 
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图 5-5: 数据 透视 图 报表 的 直方 图 
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通过 直方 网， 我 们 看 到 ， 分 布 类 似 于 一 个 钟 形 则 线 ， 它 向 右 侧 倾斜 ， 中 心 大 约 在 0.275 左 右 。 


5.8.2 ”解读 Hack 


用 公式 计算 组 条 的 好 处 之 一 是 , 你 能 很 容易 地 改变 组 条 的 公式 。 以 下 是 采用 其 他 公式 时 的 几 
点 建议 : 








ROUNDDOWN (<¢valvye> , ¢significance> ) 和 ROUNDUP (¢valuye> , ¢significance> ) 

这 个 ROUNDDONN 函数 向 下 舍 人 到 最 近 的 有 效 数 字 。 例 如 ，ROUNDDOWN(3.59,0) 等 于 3 ， 
ROUNDDOWN(3.59,1) 等 于 3.5。 同 样 ，ROUNDUP 是 向 上 舍 入 到 最 近 的 有 效 数字 。ROUNDUP(3.59,0) 等 于 
4，ROUNDUP(3.59,1) 等 于 3.6。 





LOG (<va7yve> ,<¢base> ) 

使 用 对 数 大 小 的 组 条 时 ， 有 时 可 用 此 函数 绘制 对 数 刻 度 值 。 您 可 以 结合 L0G 函 数 和 ROUND 函数 
来 创建 可 变 大 小 的 组 条 。 

CONCATENATE (...) 

CONCATENATE 函 数 不 计算 数字 , 它 把 文字 放 在 一 起 。 如 果 你 想 明 确 列 出 范围 ( 如 3.500~3.599 )， 
可 以 使 用 CONCATENATE 来 创建 。 例 如 CONCATENATE (ROUNDDOWN(3.59,1),"to",ROUNDUP(3.59,1)-0.01) 
返回 3.5 到 3.59。 

如 果 你 想 更 进一步 ， 可 以 用 一 个 命名 值 取 代 组 条 。( 例如 ， 命 名 单元 格 Al bin_size )。 这 可 
以 很 容易 地 动态 改变 组 条 大 小 和 试验 不 同 数量 的 组 条 。 














一 一 约瑟夫 ， 阿 德勤 


| Wy 5 去 得 两 分 
7 在 机 杭 球 比赛 中 ， 什 么 时 候 过 试 两 分 转换 是 正确 约 选 皇 ? 无论 你 使 用 哪个 “图 表 … 
当 侨 计 学 家 都 对 此 有 争议 时 ， 问 题 变 得 更 加 复杂 。 


几 年 前 ， 当 我 的 本 地 职业 橄 槛 球 队 正 在 输 掉 一 场 势均力敌 的 比赛 时 , 我 正 非 常 享受 地 观看 他 
们 的 比赛 。 与 其 说 我 对 本 地 球 队 的 低迷 表现 感 兴趣 , 不 如 说 我 对 迷糊 的 教练 试图 读 懂 两 分 转换 图 


在 橄榄 球 中 ， 触 地 得 分 后 ( 触 地 本 身 得 6 分 ), 得 分 队 有 两 种 选择 : 获得 一 个 “加 分 ” 
或 两 个 加 分 。 通 常情 况 下 ,得 分 队 会 选择 通过 将 球 踢 入 达 阵 区 底部 架设 的 两 根 球门 
柱 而 获得 一 个 额外 的 分 数 ( 像 短 距离 射门 得 分 一 样 )， 但 他 们 也 可 以 选择 “ 达 阵 再 
达 阵 ”分 ( 称 为 两 分 转换 )， 指 进攻 方 以 跑 或 传 的 方式 再 次 通过 对 方 的 达 阵 区 底部 。 
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后 来 体育 新 闻 记 者 “证 实 ”"， 很 明显 ， 当 时 教练 不 知道 如 何 读 图 表 。 具 体 来 说 ， 当 他 解读 代 
表 球 队 落 后 或 领先 多 少 分 的 那 列 时 , 他 认为 那 意 味 着 是 他 们 得 到 转换 分 数 之 后 , 一 支 球 队 落 后 或 
领先 的 分 数 。 

正当 我 沉思 为 什么 一 个 国家 橄榄 球 联赛 (NEFL ) 主教 练 没有 学 会 如 何 读 懂 图 表 时 ,我 开始 想 
知道 是 谁 制作 了 这 张 “ 图 表 ”, 它 是 基于 什么 原则 制作 的 。 后 来 ,我 搜索 了 “官方 图 表 ”， 我 发 现 
两 张 “ 官 方 ” 图 表 并 不 完全 一 致 。 

最 近 , 我 磁 到 一 张 基于 可 能 结果 的 概率 统计 分 析 和 剩余 时 间 ( 由 剩余 的 持 球 数 表示 ) 的 图 表 。 
这 张 图 表 和 我 之 前 发 现 的 图 表 都 不 一 样 。 

这 个 Hack 是 写 给 你 的 , 教练 。 它 从 统计 学 的 角度 分 析 , 什么 时 候 该 去 得 两 分 , 什么 时 候 应 该 
满足 于 再 得 一 分 。 







































































5.9.1 传统 的 两 分 转换 图 表 


当 你 在 电视 上 看 到 一 个 教练 拿 着 一 张 塑料 夹层 卡 , 在 决定 是 否 得 两 分 前 研究 它 时 , 体育 节目 
解说 员 喜 欢 把 这 张 卡 称 为 图 表 , 不 过 ， 正 如 上 一 节 说 到 的 那样 ， 有 很 多 可 以 使 用 的 图 表 。 导 致 这 
种 细微 差异 的 原因 可 能 在 于 一 种 图 表 被 国家 橄榄 球 联盟 (NFL ) 采用 ， 其 他 的 作为 经 典 标准 决策 
集 被 大 学 橄榄 球 比赛 采用 。 

差异 也 可 能 基于 这 样 的 事实 : 大 学 的 图 表 是 为 特定 的 、 可 能 更 积极 或 更 自信 的 球 队 制 订 。 大 
学 图 表 似 乎 为 胜利 而 制订 ， 而 不 是 平局 。 虽 然 大 学 橄榄 球 现在 有 加 时 赛 的 规则 , 但 还 处 于 起 步 阶 
段 ， 而 专业 橄榄 球 比 赛 有 加 时 赛 已 经 很 长 时 间 了 。 

国家 橄榄 球 联赛 ( NFL ) 的 图 表 由 诺 姆 : 希 茨 格 斯 (Norm Hitzges ) 的 网 站 http://www. 
normhitzges.com/thechart.htm 提 供 ，( 诺 姆 是 达拉斯 的 一 位 播音 员 ， 还 是 一 个 全 能 运动 专家 )。 大 
学 图 表 (在 http://www.NFL.com/fans/twopointconv.html ) 正式 使 用 于 20 世 纪 70 年 代 ， 由 加 州 大 学 


















































洛杉矶 分 校 (UCLA ) 开发 制 得 。 表 5-14 对 两 张 图 表 的 决策 建议 进行 了 整合 。 
表 5-14: 两 分 尝试 的 经 典 决策 
分 数落 后 或 超前 
0 1 2 3 4 5 6 7 8 9 10 11 12 
落后 (NFL) 1 1 2 1 1 2 1 1 1 1 2 1 1 
落后 (大 学 ) 2 2 1 2 1 1 1 2 1 2 2 
0 1 2 3 4 5 6 7 8 9 10 11 12 
领先 (NFL) 1 2 1 1 2 2 1 1 1 1 1 2 2 
领先 (大学) 2 1 1 2 2 1 1 1 1 1 1 2 
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加 州 大 学 洛杉矶 分 校 的 图 表 没 有 提供 当 比 分 为 平局 时 的 决策 建议 , 也 没有 提供 当 你 的 球 队 处 
于 落后 时 的 建议 。 另 一 方面 ,， NEFL 的 图 表 对 所 有 场合 和 情形 都 提出 了 决策 建议 。 如 讨论 的 那样 ， 
主要 差别 似乎 在 于 你 是 否 愿 意 为 平局 而 战 。 加 州 大 学 洛杉矶 分 校 显然 不 想 为 平局 而 战 ， 而 NFL 的 
图 表 则 没有 这 样 的 顾 虚 。 





























5.9.2 ”现代 超级 科技 图 表 


在 现实 世界 中 , 一 组 统计 概率 控制 了 体育 赛事 的 结果 , 关于 是 否 去 得 两 分 或 获得 额外 一 分 的 
决定 ， 应 根据 更 多 的 信息 来 判断 ， 而 不 仅仅 根据 分 数 和 球 队 的 输赢 信息 。 在 实际 比赛 的 情况 下 ， 
聪明 的 教练 会 将 如 下 额外 因素 考虑 进去 : 

口 射门 球员 射门 得 分 的 可 能 4 

口 球 队 在 给 定 的 两 分 转换 情况 下 得 分 的 可 能 性 ; 

口 球员 目前 的 健康 状况 、 态 度 和 技能 ; 

口 球 队 还 会 获得 多 少 持 球 机 会 。 

过 去 的 统计 数据 显示 ,平均 而 言 ， 国 家 橄榄 球 联盟 (NFL ) 的 橄榄 球 队 ， 获 得 额外 一 分 的 几 
率 大 约 是 98%， 获 得 两 分 尝试 的 几率 约 为 410%。 教 练 必须 利用 自己 的 经 验 和 直觉 来 衡量 自身 球员 
目前 的 能 力 水 平 ， 而 这 个 分 数 和 图 表 没 有 任何 关系 。 

然而 ,对 于 剩余 的 持 球 机 会 ， 这 正 是 建立 在 概率 基础 上 的 决策 系统 需要 考虑 的 信息 类 型 。 从 
结束 点 回 推 假 设 出 来 的 、 考 虑 了 两 种 选择 概率 ( 98% 的 一 分 和 40% 的 两 分 ) 的 橄榄 球 比赛 ， 统 计 
学 家 们 已 经 制作 出 不 仅 基于 目前 得 分 ， 同 时 也 基于 两 支 球 队 剩 余 持 球 机 会 总 数 的 图 表 。 

在 2000 年 《几率 》( Chance ) 期 刊 (第 13 卷 ， 第 3 号 ) 中 ， 哈 罗 德 ， 萨 克 罗 维 获 (Harold 
Sackrowitz ) 使 用 动态 编程 方法 提出 了 新 的 分 析 结 果 。 表 5-15 显 示 了 萨 克 罗 维 茨 博士 所 做 图 表 的 
一 部 分 。 


表 5-15: 两 分 尝试 的 现代 决策 













































































剩余 持 球 数 
1 落后 
领先 
2 落后 
领先 
3 落后 


领先 











天 二 | 一 一 | 一 一 
DD 一 | 一 | 一 
一 iD 一 中 | 一 Dh 
一 一 | 人 | 
一 一 | 一 一 

一 一 | 一 | 
一 DI 一 DDI- 
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( 续 ) 
落后 或 领先 的 分 数 
4 落后 | 1 1 > 1 1 2 |1 1 2 2 2 1 
领先 | 1 2 1 1 2 |1 1 1 1 1 1 2 
5 落后 | 1 1 六 1 1 2 |1 1 2 2 2 1 
领先 | 1 2 1 1 1 2 |1 1 1 1 1 1 2 
6 落后 | 1 1 2 1 1 2 |1 1 2 2 2 1 2 
领先 | 1 2 2 1 1 2 |1 1 1 1 1 1 2 
这 个 两 分 转换 图 表 基 于 比赛 中 所 有 可 能 的 起 始 分 数 , 假设 了 额外 一 分 或 两 分 转换 情况 下 成 功 
的 基本 概率 。 一 个 普通 国家 橄榄 球 联盟 ( NFL ) 比赛 小 节 ， 总 共有 6 次 持 球 进攻 的 机 会 ， 所 以 把 


这 张 图 表 视 作 在 第 四 小 节 最 有 用 。 萨 克 罗 维 次 还 假定 加 时 赛 50% 的 几率 获胜 。 


5.9.3 ”如 何 生效 


表 5-15 的 计算 原理 和 下 面 的 简单 示例 一 样 : 

(1) 想象 一 下 ， 你 落后 一 分 ， 且 再 次 得 到 球 的 可 能 性 不 大 。 

(2) 你 有 98% 的 几率 通过 射门 获得 额外 一 分 , 你 也 有 50% 的 几率 在 加 时 赛 中 获胜 。 获 得 额外 一 
分 导致 你 有 49% 的 获胜 几率 (0.98 x 0.50=0.49 )。 

(3) 你 有 40% 的 几率 进行 两 分 转换 , 所 以 达 阵 再 达 阵 获得 两 分 导致 你 有 40% 的 获胜 几率 。 失败 
结束 比赛 ， 成 则 功 赢得 比赛 。 

(4) 49% 比 40% 更 好 , 所 以 你 应 该 选择 额外 一 分 。 请 注意 ,如 果 你 相信 你 的 球 队 两 分 转换 的 几 
率 比 49% 更 高 ， 你 应 该 选择 两 分 。 按 照 这 样 的 计算 思路 ， 经 过 一 个 较 长 的 连续 持 球 ， 就 形成 了 表 
5-15 所 示 的 决策 树 。 

下 一 次 你 指导 至 关 重 要 的 橄榄 球 比赛 日 需要 作出 关键 决策 时 , 你 应 该 使 用 哪 张 图 表 ? 这 取决 
于 你 自己 ,但 要 记 住 那 位 迷糊 的 橄榄 球 教练 ， 那 个 几 年 前 我 在 电视 上 看 到 的 那 位 ， 他 在 次 年 被 
Dick Vermeil 取 代 。Dick Vermeil 被 认为 是 更 聪明 的 教练 ， 而 且 帮 助 开 发 了 加 州 大 学 洛杉矶 分 校 的 
两 分 转换 表 ， 如 表 5-14 所 示 。 现 在 你 知道 这 个 故事 的 剩余 内 容 了 ! 


















































J 5.10 ” 按 优 劣 程度 排序 
| 1 有 很 多 方法 可 以 使 用 数据 判断 任何 体育 项 目 上 谁 是 最 好 的 。 然 而， 所 有 了 比较 体育 运动 
上 的 个 体 表现 的 直观 方法 都 需要 考虑 效 度 问 题 。 


我 和 我 的 朋友 们 总 是 在 竞争 。 最 近 一 段 时 间 , 我 们 的 战斗 舞台 一 直 是 扑克 。 按 照 惯 例 ， 我 和 
朋友 们 只 集 在 我 家 , 参加 一 个 得 州 扑克 锦标 赛 。 这 是 一 个 非 正式 的 比赛 , 但 大 家 都 对 它 非 常 认 真 。 
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我 们 的 扑克 锦标 赛 的 规则 是 : 每 个 人 开始 都 用 等 量 的 筹码 ， 当 筹码 没 了 , 他们 也 就 离开 了 。 有 一 
人 第 一 个 离开 ， 有 一 人 最 后 一 个 离开 ， 还 有 一 些 人 在 中 间 离 开 。 因 此 ， 举 例 来 说 ， 如 果 7 个 人 打 
比赛 ， 就 有 人 排 在 第 一 、 第 二 、 第 三 、 第 四 、 第 五 、 第 六 和 第 七 。 

我 们 都 认为 自己 技艺 不 错 且 相当 有 竞争 力 , 我 们 淘 望 有 一 种 客观 的 方法 来 比较 比赛 表现 。 作 
为 该 组 中 的 统计 学 家 之 一 , 我 当仁不让 地 设计 出 具有 某 种 客观 指标 的 多 种 方法 , 这 种 指标 使 得 所 
有 参赛 者 能 够 将 他 们 之 间 的 表现 进行 相互 比较 , 从 而 能 一 劳 永 逸 地 判断 谁 是 最 好 的 玩家 , 谁 只 是 
偶尔 交 好 运 而 已 。 这 是 关于 我 探索 和 选择 统计 解决 方案 的 故事 。 我 并 不 是 要 把 结果 说 出 来 , 但 我 
知道 ， 没 有 一 个 统一 的 最 佳 解决 方案 。 









































5.10.1 如 何 公 平 排序 

一 些 有 竞争 力 的 组 织 , 如 体育 联盟 和 协会 ,， 经常 遇 到 如 何 确定 最 佳 这 种 问题 。 问 题 的 关键 是 
如 何在 各 种 类 别 、 场 地 和 场合 概括 总 结 表现 。 

在 体育 界 ， 有 3 种 常用 的 方法 可 用 于 作出 谁 “ 最 好 ”的 判断 。 所 有 的 方法 在 直觉 上 都 基本 讲 
得 通 ， 但 每 种 方法 都 有 其 特定 的 优 缺 点 。 

首先 ， 让 我 们 来 看 看 ,我 要 分 析 的 数据 的 性 质 。 你 的 数据 可 能 和 我 的 数据 类 似 ， 不论 你 运行 
的 是 每 周 家 庭 大 富翁 游戏 的 数据 还 是 职业 高 尔 夫 协会 的 数据 。 昌 然 扑 克 不 是 一 项 运动 , 但 任何 有 










































































组 织 的 、 有 竞争 的 努力 都 能 提供 排名 的 数据 。 表 5-16 显 示 了 我 自己 的 夏季 联赛 的 扑克 比赛 结果 。 
表 5-16: 夏季 扑克 联赛 数据 
保罗 丽 莎 比 利 贝 宁 马克 布鲁斯 “| 凯 黄 蒂 姆 戴 维 

5/14 6 5 4 3 2 1 

5/21 3 6 4 5 7 2 1 

5/28 5 4 1 3 2 

6/4 4 6 3 7 2 5 1 

6/11 4 5 6 1 3 

6/18 5 4 2 3 1 

6/25 1 4 3 5 2 

7/2 1 5 4 3 
































你 可 以 看 到 ，9 名 玩家 至 少 都 参加 了 一 场 比 赛 , 但 没有 任何 一 场 是 所 有 玩家 都 参加 的 。 如 果 
一 个 人 在 某 一 天 晚上 没有 数字 , 那 是 因为 他 没 参赛 。 这 在 体育 运动 中 是 常见 情况 ,如 高 尔 夫 球 和 
网 球 。 

在 两 种 情况 下 ，7 人 上 场 ， 但 在 其 他 场合 ， 只 有 5 人 坐 在 一 起 打牌 。 有 4 个 人 参加 了 全 部 的 8 
场 比赛 。( 这 些 都 是 铁杆 玩家 ， 他 们 不 得 不 承认 ， 他 们 在 认识 什么 是 生命 中 最 重要 的 这 件 事 上 有 
点 问题 。) 有 一 名 玩家 戴 维 ， 只 参加 了 一 场 比赛 。 
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玩家 名 字 下 的 数字 表示 他 们 的 出 局 顺序 。 如 果 有 6 名 玩家 ， 你 第 一 个 出 局 ， 那 你 会 得 到 一 个 
点 数 ， 排 在 最 后 一 名 。 如 果 你 是 6 名 玩家 的 赢家 ， 你 会 因为 是 第 一 名 而 得 到 6 个 点 数 。 


肛 这 个 计 分 系统 有 一 些 需 要 注意 的 地 方 。 首 先 ， 你 只 要 参赛 就 会 得 到 至 少 一 个 点 数 。 
其 次 ， 如 果 有 更 多 的 玩家 参与 ， 你 就 需要 更 多 的 积分 来 赢得 比赛 。 




















那么 ， 如 何在 扑克 联赛 中 对 玩家 进行 等 级 排序 ?以 下 是 3 种 常见 的 解决 方案 ， 所 有 这 些 方 案 
都 多 少 起 点 作用 。 

1. 总 点 数 

对 我 而 言 , 首先 浮现 在 脑海 中 的 是 简单 地 把 各 场 比赛 的 点 数 加 起 来 , 并 根据 玩家 的 总 点 数 对 
其 进行 排序 。 这 是 名 人 按 收入 排名 或 银行 动 匪 按 自 己 的 犯罪 数量 排名 时 采用 的 方法 。 只 需要 参加 
很 多 比赛 就 能 提升 你 的 名 次 。 要 想 成 为 年 度 的 高 尔 夫 球 手 ,你 必须 参加 很 多 场 比赛 ,此 外 在 这 些 
比赛 中 ， 你 的 表现 要 过 得 去 。 

2. 平均 表现 

第 二 种 方法 是 用 总 积分 除 以 玩家 参加 的 比赛 数量 得 到 平均 点 数 。 产 生 一 个 平均 点 数 的 妙 处 在 
于 ， 你 得 到 了 一 个 代表 典型 表现 水 平 的 数字 。 这 对 测量 难以 提 摸 的 东西 是 理想 的 ， 比 如 天 赋 。 你 
在 扑克 中 (或 任何 其 他 赛事 ) 的 平均 表现 应 该 是 能 力 的 最 佳 单一 指标 。 

3. 总 的 获胜 数 

第 三 种 方法 在 团队 运动 中 最 简单 、 最 常用 ， 即 计算 胜利 的 次 数 。 最 经 常 获胜 的 玩家 是 最 好 的 
玩家 。 此 方法 适用 于 锦标 赛 风 格 的 扑克 (我们 玩 的 那 种 )， 以 及 任何 有 一 个 明确 赢家 的 赛事 。 





















































5.10.2 比较 3 种 方法 


每 种 排名 方法 都 有 各 自明 显 的 优势 ， 并 各 司 其 职 。 表 5-17 展 示 了 在 这 3 种 排名 系统 下 每 个 玩 
家 的 值 。 


表 5-17: 扑克 表现 摘要 





保罗 丽水 比 利 贝 宁 马克 布鲁斯 ” 凯 贡 蒂 姆 戴 维 


























所 有 这 3 个 评分 系统 都 是 合理 的 。 但 是 关于 谁 是 最 好 的 问题 ,这 3 个 系统 都 有 不 同 的 答案 ! 对 
































像 我 这 样 的 扑克 科学 家 来 说 ， 这 无 疑 是 一 个 令 人 诅 丧 的 发 现 。 因 为 这 3 种 方法 都 有 理由 被 认为 是 
“最 好 ”的 排列 方法 ， 而 每 个 方法 都 产生 不 同 的 “最 佳 ” 扑 到 玩家 ， 这 有 点 矛盾 。 表 5-18 展 示 了 
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采用 各 个 计 分 方法 的 排名 区 别 。 
表 5-18: 扑克 排行 榜 








平均 点 数 
获胜 次 数 














请 注意 每 个 系统 下 的 “最 佳 玩 家 ”有 什么 区 别 。 在 总 点 数 系统 下 ， 贝 宁 是 最 好 的 ; 在 平均 表 
现 系统 下 ， 丽 莎 是 最 好 的 ; 在 总 的 获胜 数 系统 下 ，3 人 并 列 第 一 ， 但 贝 宁 和 丽 莎 却 不 在 其 中 。3 
种 方法 唯一 真正 的 一 致 是 : 戴 维 被 评 为 最 差 的 玩家 。( 对 不 起 ， 戴 维 ， 但 数字 不 会 说 谎 ， 我 为 公 





众 的 嘲笑 感到 遗憾 。 也 许 我 可 以 把 这 本 书 的 免费 复印 本 送 你 ， 向 你 示 好 ? ) 


我 指派 排名 时 ， 通 过 将 那些 平局 的 人 进行 平均 来 打破 平局 。 换 和 句 话 说 ， 比 利 、 马 克 
和 我 自己 在 获胜 数 系统 下 并 列 排名 第 一 ， 所 以 1、2、3 的 排名 ,平均 后 是 2， 这 就 是 我 
们 的 排名 。 


如 果 有 3 个 不 同 的 评分 系统 产生 3 个 不 同 的 排名 , 很 显然 , 它们 不 可 能 都 同等 有 效 。 它 们 不 能 
都 以 相同 方式 产生 真正 体现 我 们 感 兴趣 变量 的 分 数 , 这 个 变量 定义 为 玩 扑克 的 能 力 。 解决 方案 没 
有 包含 最 佳 方法 的 选择 。 我 的 目标 不 是 确定 最 佳 的 系统 并 采用 它 ， 我 的 目标 是 提供 有 效 的 信息 ， 
让 别人 按 他 们 的 需求 解释 他 们 的 数据 。 

我 的 解决 办 法 是 提供 基于 3 种 计 分 方法 的 所 有 3 种 排名 。 这 样 一 来 , 玩家 可 以 选择 把 重点 放 在 
对 他 们 最 有 意义 的 方法 所 产生 的 排名 结果 上 。 


5.10.3 故事 的 结尾 

在 我 的 扑克 联赛 中 ， 对 玩家 最 有 意义 系统 是 让 他 们 排名 最 高 的 系统 。 想 象 一 下 。 

“任何 一 种 方法 可 能 都 是 可 接受 的 、 准 确 的 。” 带 着 这 个 认识 ,晚上 我 安稳 地 睡 着 了 。 毕 竟 ， 
这 3 种 方法 中 没有 一 种 ， 会 犯 这 样 一 个 错误 : 得 出 我 是 最 好 玩家 。 关 于 这 些 方法 ， 其 中 或 自身 一 
定 有 某 种 效 度 证 据 ! 
现实 生活 中 的 职业 体育 组 织 通 过 创建 复合 的 积分 系统 来 处 理 单个 系统 的 优 缺 点 。 一 些 在 网 球 
和 高 尔 夫 球赛 中 (还 有 扑克 锦标 赛 ) 用 来 改善 排名 系统 的 措施 包括 : 
口 结合 很 长 一 段 时 间 的 表现 数据 ; 
口 对 赢得 更 困难 的 比赛 给 予 更 多 的 点 数 ; 
口 同时 使 用 平均 表现 和 总 点 数 系统 ， 以 奖励 优秀 球员 和 频繁 参与 的 球员 。 
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有 点 讽刺 的 是 , 这 些 系统 中 可 能 更 
狂 。 使 排名 系统 更 有 效 的 尝试 ， 经 常 被 


> 


平 、 更 准确 的 系统 常常 被 媒体 和 球迷 认为 过 于 复杂 和 疯 
众 视 为 无 效 而 遭 到 拒绝 。 


> 


| 5.11 通过 几率 估计 圆周 率 
i 站 上 席 计 学 家 认为 任何 重要 的 东西 都 可 以 使 用 统计 数据 末 发 现 。 这 可 能 是 正确 的 ,因为 事 
实证 明 你 可 以 使 用 统计 信息 未 估计 科学 中 最 重要 约 基 础 和 值 之 一 ， 圆周 六 。 


计算 圆周 率 是 所 有 办 露头 角 的 天 才 的 常规 技能 之 一 。 比 如 ,我 记 住 的 22 除 以 7 的 结果 就 非常 
接近 准确 值 。 还 有 多 种 计算 方法 ， 其 中 一 些 比 其 他 的 更 为 精确 。 不 过 ,我 最 喜欢 的 方法 ， 是 采用 
几率 和 漫长 的 、 寂 宽 的 海上 航行 或 其 他 强制 的 孤独 时 间 等 元 素 。 好 奇 吧 ? 继续 往 下 读 吧 。 

在 展示 如 何 估计 圆周 率 值 之 前 , 我 将 以 介绍 几 个 基本 的 几何 事实 来 开始 我 们 的 讨论 。 不 要 怒 
慌 , 我 对 几何 懂 的 不 是 很 多 , 所 以 我 们 不 会 在 这 上 面 花 很 多 时 间 。 我 只 会 大 致 讲解 一 些 基础 知识 ， 
使 我 们 能 了 解 这 个 技艺 的 魔力 。 















































5.11.1 圆周 率 


在 几何 里 ,圆周 率 是 一 个 值 大 概 为 3.141 59 的 数 〈 用 r 这 个 符号 表示 )， 人 们 已 经 发 现 圆 周 率 
和 圆 形 的 不 同 部 分 之 间 的 关键 关系 ， 如 图 5-6 所 示 。 




















圆周 率 = 周 长 /直径 











周 长 | 














图 5-6: 计算 圆周 率 

例如 ， 如 果 你 用 圆 的 直径 乘 以 圆周 率 ， 你 会 得 到 圆 的 周 长 。 如 果 你 把 圆 的 半径 平方 再 乘 以 
圆周 率 ， 你 会 得 到 圆 的 面积 。 

也 许 ， 这 都 很 栈 , 但 这 是 那些 喜欢 几何 的 人 的 主要 兴趣 ,不 是 统计 学 家 的 主要 兴趣 。 但 只 要 


™ 一 等 。 


























拭 
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5.11.2 ”圆周 率 和 落 针 


在 1700 年 ， 乔治 -路 易 : 勒 克莱尔 ( Georges-Louis Leclerc ) 向 全 世界 提出 了 半 几 何 / 半 统计 的 
难题 。 他 被 称 为 布 汉 伯 事 ， 或 有 诸如 此 类 的 称号 ， 所 以 这 个 问题 被 称 为 布 冯 投 针 问题 ( Buffon’s 
Needle Problem )。 他 提出 了 个 大 概 ， 没 有 细节 ， 我 在 这 里 总 结 一 下 。 


想象 一 下 ， 一 个 针头 随机 落 在 两 条 平行 的 水 平 线 上 。 两 条 线 之 间 的 距离 远大 于 针 的 长 度 。 针 
落 在 其 中 一 条 线 上 的 几率 是 多 少 ? 

有 些 问 题 你 第 一 次 听 到 时 觉得 不 可 能 解决 ， 这 个 问题 就 是 其 中 之 一 , 但 它 是 可 以 解决 的 。 没 
有 必要 在 这 里 花费 时 间 计 算 最 终结 果 , 但 我 肯定 能 做 到 这 一 点 ,我 向 你 保证 。 真 的 , 我 可 以 。 真 
的 。 解决 方案 涉及 一 些 几何 知识 , 它 考虑 到 了 两 个 关键 的 信息 成 分 。 任 何 给 定 的 随机 落 点 位 置 的 
关键 在 于 : 
口 针 的 中 心 距离 最 近 的 水 平 线 多 远 ; 
口 针 和 最 近 水 平 线 的 垂直 线 的 夹 角 是 多 少 度 。 
用 这 两 个 信息 定义 针 的 随机 位 置 形 成 了 一 些 有 助 于 简化 问题 的 通用 观察 。 
口 如 果 针 的 中 心 正 好 在 一 条 水 平 线 上 ， 那 么 不 管 它 的 角度 如 何 ， 针 总 是 触 碰 到 那 条 线 。 
口 如 果 针 的 中 心 足够 接近 水 平 线 ， 距 离 小 于 针 长 度 的 一 半 ， 那 么 针 有 时 会 触 磁 到 线 。 针 的 
角度 决定 了 针 是 否 会 触 碰 到 线 。 
口 如 果 针 的 中 心 跑 线 的 距离 超过 针 一 半 的 长 度 ， 那 么 不 管 针 的 角度 如 何 ， 针 永远 不 会 触 碰 
到 线 。 
口 针 越 接近 平行 线 ， 针 碰 到 那 根 线 的 几率 就 越 大 。 

所 有 可 能 的 落 针 位 置 可 以 绘制 为 一 条 曲线 , 展示 所 有 可 能 的 与 线 的 距离 以 及 所 有 可 能 的 与 垂 
直线 的 角度 。 图 上 有 三 角 函 数 ， 数 学 家 们 已 经 用 下 面 的 等 式 定 义 了 这 样 的 曲线 : 


















































概率 = (2)( 针 的 长 度 ) 
(r)( 线 间距 ) 
这 是 问题 的 答案 。 让 我 们 赶快 用 一 些 真实 的 数字 试 试 吧 ， 只 是 为 了 验证 Leclerc 的 工作 。 想 
一 根 3 英寸 长 的 针 随 机 掉 落 在 缝 纪 台 上 ， 台 上 有 两 根 距 离 为 4 英寸 的 平行 线 。 
针 碰 到 其 中 一 根 平行 线 的 几率 是 多 少 ? 以 下 是 必要 的 计算 : 














Ee 


(xj( 线 间 踊 (3.1459)(4) ”12.566 
针 碰 到 其 中 一 根 线 的 几率 约 为 48%。 
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a 当 你 想到 一 个 地 板 上 满 是 落 针 和 线 的 大 房间 时 ， 你 的 赌博 之 心 是 不 是 蠢蠢欲动 了 。 
ww 去 吧 ， 给 你 更 多 的 力量 。 这 一 法 则 已 经 在 一 些 你 可 能 见 过 的 嘉年华 游戏 里 生效 了 。 
有 没有 注意 到 ， 那 些 乒 乓 球 落 入 鱼 红 或 者 足球 通过 铁 环 的 次 数 是 多 么 稀少 ? 


5.11.3 ”概率 和 圆周 率 


我 保证 你 可 以 使 用 几率 来 估计 圆周 率 , 不 过 , 不 是 使 用 圆周 率 来 计算 几率 。 数 学 的 力量 使 得 
我 们 能 够 移动 等 式 中 的 任何 元 素 , 所 以 等 号 右 侧 的 任何 元 素 符号 都 可 以 被 移动 到 左 侧 。 我 们 可 以 
像 这 样 移动 我 们 的 概率 公式 计算 圆周 率 : 

















| _O)( 针 的 长 度 ) 
( 慨 率 )( 线 距 间 ) 
我 会 使 用 我 们 测试 这 个 概率 等 式 时 用 的 数字 来 证 明 其 有 效 性 。 我 们 已 经 知道 圆周 率 的 正确 答 
案 是 什么 了 ， 那 么 让 我 们 来 看 看 公式 是 否 生效 : 








(2)( 针 的 长 度 ) ” (2)@) 
(概率 )( 线 距 间 ) ” (0.477)(4) 





=3.1447 


该 公式 计算 的 圆周 率 的 值 为 3.144 7， 这 相当 接近 3.141 59。 如 果 我 们 允许 我 们 的 数字 有 更 多 
的 小 数位 ， 那 我 们 可 能 会 有 一 个 更 准确 的 答案 。 


5.11.4 “使 用 概率 估计 圆周 率 


在 我 们 的 例子 中 ,我们 知道 概率 ,所 以 我 们 可 以 利用 这 个 信息 来 计算 圆周 率 。 但 是 ， 如 果 你 
不 知道 圆周 率 , 却 需要 计算 它 的 时 候 呢 ? 如 果 你 被 困 在 一 个 荒 岛 上 , 或 长 时 间 在 海上 航行 或 一 条 
腿 骨折 躺 在 床上 , 无 法 获得 关于 圆周 率 准确 值 的 相关 参考 资料 ”进一步 讲 , 假设 你 需要 使 用 圆周 
率 计 算 圆 的 周 长 或 球 的 体积 ， 或 者 计算 几何 、 金 融 、 物 理 中 任何 的 值 。 一 场 置 梦 ， 对 吗 ? 你 可 以 
使 用 这 个 公式 ， 只 需 进行 一 场 实验 并 收集 数据 ， 就 能 相当 准确 地 计算 圆周 率 。 

用 两 条 水 平 线 设 立 一 个 区 域 ， 撒 一 些 针 ， 并 保持 跟踪 。 测 量 平行 线 间 的 距离 以 及 针 的 长 度 ， 
剩 下 的 繁重 工作 就 交 给 几率 吧 。 从 很 多 落 针 收集 大 量 的 数据 样本 , 得 到 精确 到 小 数 点 后 几 位 的 概 
率 ， 也 许 约 有 一 千 次 落 针 。 祝 你 好 运 ， 继 续 认 真 记录 。 

比方 说 ,你 画 两 条 距离 为 8 英寸 的 平行 线 , 使 用 约 7 英寸 长 的 编织 针 。 如 果 使 用 这 样 的 设备 进 
行 了 大 量 落 针 实 验 , 你 可 能 会 发 现 针 触 碰 到 线 的 几率 介 于 50%~60%。 假如 说 ， 是 55%。 要 使 用 这 
个 数据 来 计算 圆周 率 ， 你 将 像 这 样 运用 数学 : 
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(2)( 针 的 长 度 ) _ (2)7) _ 14 


三 3. 
(概率 )( 线 间距 ) (0.55)(8) ”4.4 

你 会 发 现 ，3.18 这 个 值 非常 接近 图 5-6 所 示 的 周 长 和 直径 之 比 。 

如 果 你 的 视力 不 如 从 前 ,就 没有 必要 使 用 难以 看 见 的 针 。 你 可 以 使 用 相同 的 逻辑 ,让 一 支 铅 
笔 落 在 你 的 办 公 桌 上 , 或 将 弹 珠 滚动 到 一 个 定义 好 的 区 域内 ,或 让 跳伞 者 降落 在 一 个 长 方形 的 目 
标 内 。 你 需要 两 条 平行 的 线 ， 两 条 让 铅笔 、 弹 珠 或 跳 企 者 可 以 有 机 会 降落 进去 的 线 ， 还 有 你 需要 
知道 物品 的 长 度 。 只 要 结果 是 随机 的 ,什么 物品 都 可 以 ,找到 降落 在 草 埃 上 的 跳伞 者 比 找到 一 根 
针 更 容易 。 











第 6 章 





精明 思考 
( Hack #61~#75 ) 





本 章 着 重 讲解 那些 可 以 帮 你 更 清晰 、 更 明智 或 更 具 创 造 性 地 进行 思考 的 Hack。 开篇 我 们 利用 
概率 法 则 , 证 明 你 自己 比 超级 英雄 更 聪明 [Hack #61]。 通过 掌握 统计 捷径 [Hack #66] 以 及 发 现 舞 星 
的 能 力 [Hack #64]， 我 们 能 够 长 久 地 感觉 自己 很 聪明 。 

随后 ， 通 过 发 挥 你 的 怀疑 面 使 你 自己 和 他 人 印象 深刻 : 揭秘 惊人 的 巧合 [Hack #62]， 揭 示 怪 
异 现象 的 真相 [Hack #63]。 反 了 驳 (或 者 证 明 ) 超 能 力 (ESP ) 的 存在 [Hack #68] 后 ， 当 你 读 懂 你 朋 
友 的 心思 时 ， 他 们 会 感到 惊讶 [Hack #67]。 


最 后 ， 学 习 如 何 规避 和 常见 的 、 不 合 逻 辑 的 陷阱 [Hack #69]， 从 而 完成 自我 完善 的 课程 。 

既然 你 这 么 聪明 , 那么 对 你 而 言 , 注意 到 周围 其 他 人 没有 注意 到 的 事情 应 该 是 件 轻 而 易 举 的 
事 。 你 可 以 掌握 交通 拥堵 的 艺术 [Hack#4]， 探 寻 你 和 凯 文 ， 贝 肯 (Kevin Bacon ) 或 是 其 他 人 之 
间 的 联系 [Hack #72]， 识 别 出 只 有 政治 科学 家 才 知 道 的 虚假 的 选举 制度 [Hack #73]。 

本 章 的 最 后 讲解 能 够 扩展 你 视野 的 Hack。 尝 试 不 同 的 、 令 人 兴奋 的 职业 ， 比 如 间谍 和 密码 分 
析 [Hack #70]， 发 现 新 物种 [Hack #71]， 也 许 ， 甚 至 是 其 他 星球 的 生物 [Hack #75]。 



















































































Ta 6.1 比 超人 更 聪明 
站 #61 闪电 可 以 击 中 辐 一 个 地 方 两 次 ,但 可 能 性 非常 小 。 概率 法 则 使 我 们 能 够 计算 一 系列 军 
见 事件 连 夸 发 生 的 可 能 性 。 


我 们 偶尔 会 听 到 一 些 极 不 可 能 发 生 的 事件 多 次 发 生 在 同一 个 人 身上 , 比如 一 个 在 森林 里 漫步 
的 人 被 雷电 击 中 了 7 次 ,或 是 一 对 新 泽 西 夫妇 两 次 万 得 了 彩票 大 奖 。 当 他 们 出 现在 新 闻 中 时 ， 这 
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些 故 事 通常 包含 对 当地 统计 教授 的 采访 ， 教 授 会 估计 这 种 事情 发 生 的 几率 。 


计算 一 系列 事件 发 生 可 能 性 的 数学 方法 相当 简单 。 难 的 是 合理 估计 任意 单一 事件 发 生 一 次 的 
概率 。 然 后 ， 你 只 需 将 这 些 单个 概率 相 乘 ， 就 能 得 到 全 部 怪异 事件 发 生 的 可 能 性 。 





6.1.1 幸运 的 路 易 丝 . 莱恩 


为 了 展示 整个 系列 事件 发 生 可 能 性 的 计算 中 涉及 的 步骤 ,我 选择 了 文学 名 著 中 的 例子 。 路 
易 丝 . 莱恩 (Lois Lane ) 漫画 杂志 的 第 56 期 描述 了 一 系列 罕见 的 事件 ， 该 期 杂志 由 DC 漫画 在 
1965 年 4 月 出 版 。 故 事 的 通用 模式 是 : 路 易 丝 有 一 些 看 似 很 难 解释 的 超 能 力 , 但 在 故事 的 结尾 会 
对 此 有 某 种 简单 的 解释 。 

















路 易 丝 ， 莱恩， 现在 是 漫画 书 中 主人 公 超 人 的 妻子 (之 前 是 他 的 女友 和 头号 粉丝 )， 
ee 
时 代 的 路 易 丝 漫画 作为 独特 奇怪 的 漫画 创作 来 欣赏 。 路 易 丝 几 乎 每 天 都 能 成 功 挑战 

概率 。 关 于 她 的 漫画 应 该 被 列 为 统计 课程 必 读 材料 。 


我 们 要 讲 的 这 个 奇怪 经 历 包 含 了 一 个 统计 Hack, 在 故事 结尾 , 超人 对 其 进行 了 解释 。 路 易 丝 
假装 自己 具有 读 心 能 力 ， 借 此 待 在 绰号 为 “ 极 小 概率 ”的 犯罪 分 子 拉 金 身边 ,或 许 还 能 为 她 的 报 
纸 提供 热点 新 闻 素 材 。 


一 切 进展 顺利 。 她 现在 被 拉 金 绑架 了 ， 拉 金 强 迫 她 提供 “ 读 心 能 力 ”的 信息 ， 这样 他 就 可 以 
去 犯罪 。 路 易 丝 很 幸运 ,犯罪 分 子 也 一 样 ， 她 的 盲目 猜测 是 正确 的 ， 拉 金 让 她 一 直 活 着 。 路 易 丝 
的 猜测 非常 准确 ， 以 至 于 她 自己 都 开始 相信 自己 具有 超 能 力 。 


最 终 ， 解 救 了 路 易 丝 的 超人 证 明 ， 路 易 丝 只 是 笠 运 罢了 ! 很 入 运 。 令 人 吃惊 的 是 ， 
思议 的 幸运 。 路 易 丝 正确 预测 元 长 的 系列 和 准确 猜测 的 几率 是 极其 微小 的 , 她 只 是 运气 
喜 ， 路 易 丝 ! 

超人 给 出 了 路 易 丝 实现 这 一 梦幻 般 壮 举 的 几率 ,但 故事 的 作者 ( 匿名 ) 没有 提供 计算 方法 。 
让 我 们 回顾 一 下 路 易 丝 做 的 随机 猜测 , 我 们 自己 计算 , 并 检验 一 下 超人 的 数学 。 为 了 确定 这 一 系 
列 的 独立 事件 的 概率 ， 我 们 将 应 用 乘法 法 则 [Hack #5]。 























特 好 。 茶 


6.1.2 ”猜测 
在 故事 中 ， 路 易 丝 正确 猜 中 了 ( 注意 ， 是 完全 随机 地 ) 如 下 问题 : 


(1) 5 辆 相同 的 装甲 卡车 ， 哪 辆 才 是 运送 首都 银行 现金 的 ; 
(2) 公司 里 存放 工资 的 保险 箱 密码 ; 
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(3) 未 登记 的 、 镇 上 首富 的 电话 号 码 ; 

(4) 20 000 棵 树 中 ， 哪 一 棵 的 下 面 埋藏 了 银行 抢劫 犯 的 战利品 。 

超人 救 了 她 之 后 , 她 终于 在 猜测 饶 里 软 糖 数量 这 道 题 上 失败 了 。 因 为 超人 向 莱恩 女士 解释 说 
她 没有 超 能 力 ， 他 认为 她 随机 猜 中 这 4 道 题 的 几率 是 326 454 839 047 (失败 ) 比 1 (成 功 )， 或 是 
1/326 454 839 048。 

“我 明白 了 , 超人 ! 她 说 ,“ 我 很 绊 运 地 逮 到 “ 那 次 机 会 。”“ 是 的 ,” 超 人 说 ,“ 毕 竟 ， 也 有 
人 总 是 赢得 彩票 大 奖 ( 或 某 种 类 似 的 荒 雇 事情 ) ”由 超人 或 他 的 超级 电脑 计算 出 的 数字 肯定 是 很 
大 的 ， 这 好 像 是 正确 的 ， 但 我 不 认为 这 是 正确 的 。 我 的 猜测 是 ， 这 个 结果 甚至 会 更 加 不 可 思议 。 






























































6.1.3 ”计算 


让 我 们 完成 自己 的 计算 。 对 于 猜测 1 和 猜测 4, 我 们 可 以 独立 且 非 常 准确 地 计算 出 猜 中 问题 答 
案 的 几率 。 对 于 猜测 2 和 猜测 3 ， 我 们 必须 做 一 些 假设 。 


下 面 是 路 易 丝 作出 的 猜测 以 及 每 个 猜测 几率 的 真实 计算 。 











对 于 被 要 求 给 出 一 连 串 不 可 能 事件 的 可 能 性 解释 的 统计 学 家 来 说 , 这 里 所 涉及 的 数 
肛 学 是 工作 中 比较 容易 的 一 部 分 。 困 难 的 部 分 在 于 确定 开始 的 值 ， 以 及 确定 等 式 的 各 
个 部 分 。 正 如 你 看 到 的 ,我们 尝试 估计 路 易 丝 有 多 么 幸运 ， 我 们 将 要 做 一 些 适度 狂 
野 但 合理 的 猜测 ， 来 或 多 或 少 估 计 任 意 特别 事件 发 生 的 几率 。 大 多 数 时 候 ， 统 计 学 
家 无 法 准确 获知 事件 的 发 生 几 率 。 他 们 往往 专注 于 理论 情况 下 事件 发 生 的 几率 ， 而 

不 关注 莱恩 女士 那样 的 真实 生活 问题 。 


1. 猜测 一 


5 辆 相同 的 装甲 卡车 ， 哪 辆 才 是 运送 首都 银行 现金 的 ?这 是 最 简单 的 一 个 问题 。5 种 可 能 性 ， 
有 1 个 是 正确 的 选择 。 几 率 是 1/$。 

2. 猜测 二 

路 易 丝 猜测 存放 大 公司 工资 的 保险 箱 的 密码 。 这 是 一 个 真正 的 难题 。 路 易 丝 不 仅 要 猜 中 表盘 
需 转 至 的 5 个 数字 ， 同 时 也 得 猿 中 5 个 不 同 数字 必须 遵循 的 顺序 ， 并 且 要 猜 中 转盘 转动 的 方向 。 

在 现实 世界 中 , 保险 箱 有 多 种 不 同类 型 的 组 合 密码 , 所 以 很 难 确切 知道 我 们 应 该 对 这 个 问题 
做 什么 假设 。 我 对 密码 破译 进行 了 一 些 研 究 ( 可 以 说 是 因为 这 个 Hack )， 还 对 组 合 密码 保险 箱 进 
行 了 一 些 了 解 。 通 常 ， 密 码 箱 共有 1~8 个 数字 的 组 合 序列 。 我 猜测 ，3 个 或 5 个 数字 的 组 合 序列 是 
最 常见 的 。 表盘 上 的 数字 可 以 是 任意 范围 的 值 , 但 是 0~99 在 大 保险 箱 中 很 常见 ， 比 如 故事 中 的 工 
资 保险 箱 。 
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所 以 首先， 比方 说 ， 她 随机 选择 有 3 个 或 5 个 数字 组 合 的 保险 箱 。 这 个 猜测 的 几率 是 1/2。 
假设 她 每 次 从 0~99 中 随机 挑选 一 个 数字 : 序列 中 每 个 数 被 选中 的 几率 都 是 1100。 她 还 必须 猜测 
开始 的 方向 。 比 方 说 ， 大 多 数 保险 箱 (80% )， 开 始 是 向 左 侧 旋转 的 ， 而 具有 20%〈 1/5 )， 开 始 是 
向 右 旋转 〈 这 是 她 的 猜测 )。 





























13 向 左 ……5 向 左 …… 向 后 旋 到 8…… 向 前 旋 到 15。” 这 是 一 个 非常 奇怪 的 组 合 。 首 先 ， 我 们 通常 
会 以 另 一 种 方式 报 出 组 合 顺序 : 向 左 13， 而 不 是 13 向 左 。 第 二 ， 怎 么 可 能 连续 两 次 向 左旋 转 ! 毫 
无 疑问 ， 你 必须 改变 表盘 的 方向 以 锁定 序列 中 的 每 个 数字 。 毕 竞 ,表盘 在 其 转动 过 程 中 会 经 过 很 
多 数字 。 它 是 如 何 知道 是 否 要 把 每 个 经 过 的 数字 视 作 组 合 序列 的 一 部 分 ? 我 打算 假装 匿名 作者 误 
报 了 组 合 顺序 了 ， 和 否则 ， 我 不 得 不 陷 人 无 尽 的 混乱 循环 并 因此 被 困 此 处 ， 我 的 手指 停 在 键盘 上 ， 
再 也 无 法 继续 下 去 。 

最 后 ， 为 什么 路 易 丝 不 再 说 向 左 或 向 右 ， 而 开始 说 “后 退 ” 和 “前 进 ”? 这 只 会 使 得 她 的 方 
向 不 清楚 。( 难道 是 为 了 失败 时 为 自己 开脱 ? ) 再 一 次 ， 我 假定 她 使 用 这 些 术 语意 味 着 方向 的 变 
化 ， 即 使 后 退 可 能 意味 着 向 左 ， 前 进 意味 着 向 右 ， 这 也 会 使 事情 变 得 更 复杂 。 那 么 ， 对 于 这 样 一 
个 猜测 的 保守 概率 估计 是 1/2 x 1/5 x 1/100 x 1/100 x 1/100 x 1/100 x 1/100, 即 为 /100 000 000 000。 















































3. 猜测 三 
路 易 丝 还 猜 中 了 未 公开 登记 的 、 镇 上 首富 的 电话 号 码 。 有 几 种 方法 可 用 于 计算 。 


首先 ， 如 果 路 易 丝 考虑 得 很 简单 〈 没 有 冒犯 路 易 丝 粉丝 的 意思 ， 但 我 如 此 猜测 )， 她 可 能 只 
设置 这 样 的 限制 因素 : 电话 号 码 必须 有 7 位 数字 ， 并 且 不 以 0 开头 。 根 据 这 些 规则 ， 有 9 000 000 
个 可 能 的 电话 号 码 。 这 意味 着 我 们 开始 时 假定 有 10 000 000 个 可 能 的 7 位 数 (9 999 999 是 最 大 的 7 
位 数 ， 再 加 上 一 个 数 0 000 000 )。 


如 果 我 们 不 将 以 0 开头 的 数字 算 入 其 中 ， 就 消除 了 0 000 000 这 个 数字 和 所 有 的 6 位 数字 或 6 
位 数 以 下 的 数字 ( 有 9%99 999 个 )。 我 们 几乎 消除 了 百 万 种 可 能 。 那 么 ,在 这 种 情况 下 ， 路 易 丝 
猜 中 数字 的 几率 将 是 1/9 000 000。 让 我 们 给 路 易 丝 一 些 孝 虑 时 间 ， 并 假设 她 不 会 猜 自 己 的 电话 
号 码 或 其 他 她 记 住 的 电话 号 码 。 我 猜 这 样 的 号 码 可 能 有 10 人 个。 那么， 路 易 丝 将 从 8 999 990 中 选 
择 1 个 。 

如 果 更 聪明 一 些 ， 路 易 丝 ( 比方 说 , 为 了 论述 的 必要 ) 可 能 知道 大 城市 正在 使 用 的 特定 总 机 
号 、 那 些 可 能 被 用 作 未 登记 的 号 码 或 小 城镇 富裕 人 群 的 号 码 ， 等 等 。 在 以 前 ,一 个 特定 区 域 代码 
的 前 3 个 数字 有 可 能 是 总 机 号 。 我 们 一 般 估计 一 个 城市 的 人 口 规模 有 50 万 左右 ， 所 以 她 可 能 从 这 
里 面 选择 。 在 “更 聪明 的 路 易 丝 ”场景 下 ,她 的 胜算 有 了 很 大 的 提高 。 现 在 ,她 可 能 是 从 500 000 
个 数字 中 盲目 猜测 ， 而 不 是 从 9 000 000 个 数字 中 猜测 。 她 猜 中 的 几率 可 能 是 1/500 000。 我 对 路 易 
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丝 智 商 的 粗略 估计 表明 ,这 种 情况 不 是 最 有 可 能 的 , 但 她 是 一 名 大 城市 报纸 的 记者 ， 所 以 也 许 有 
这 方面 的 知识 。 让 我 们 仁 蓄 一 点 ， 就 这 么 假设 吧 。 

4. 猜测 4 

最 后 , 路 易 丝 猜 中 了 银行 抢劫 犯 的 战利品 究竟 埋 在 20 000 棵 树 中 的 哪 一 棵 下 面 。 如 同 猜 测 一 ， 
这 也 非常 容易 计算 。 如 果树 林 里 有 20 000 棵 树 的 下 面 真 的 可 能 埋 有 战利品 ( 这 个 数字 很 可 能 是 估 
计 的 或 四 舍 五 和 人 的 )， 那 么 正确 猜测 的 几率 是 1/20 000。 








6.1.4 最终 概率 


那么 ， 假 定 路 易 丝 没有 错 ， 知 道 保险 箱 和 电话 号 码 系 统 的 各 种 事情 ， 她 在 这 4 个 问题 上 连续 
正确 猜 中 的 几率 是 1/5 x 1/100 000 000 000 x 1/500 000 x 1/20 000。 保 守 地 说 ， 这 个 序列 被 幸运 猜 
中 的 几率 是 1/5 000 000 000 000 000 000 000， 甚至 比 现在 已 经 令 人 难以 相信 的 1/326 454 839 048 
还 要 引 人 注 目 。 

“我 明白 了 ,超人 ! 我 很 幸运 地 抓 住 了 正确 机 会 。 路 易 丝 总 结 道 。 的 确 如 此 。 当 然 ， 这 个 几 
率 比 将 来 超人 向 路 易 丝 求婚 的 几率 更 糟糕 ,但 那 发生 了 。 那么 ,我 应 该 向 谁 诉苦 呢 ， 超 人 还 是 超 
人 夫人 ? 























. WW 6.2 揭秘 惊人 巧合 
这 必要 许 的 模式 会 产生 一 些 不 隆 常 却 有 趣 的 一 致 性 。 下 面 教 你 如 何 解释 那些 看 起 来 令 人 礁 
以 置信 约 巧合 。 


统计 学 家 的 职责 偶尔 也 会 令 其 伤感 , 其 中 之 一 就 是 把 这 个 充满 奇 思 妙 想 、 美 好 意外 发 现 以 及 
不 时 冒 出 惊喜 的 世界 ， 变 成 一 个 沉 间 的、 可 预测 的 、 无 趣 的 地 方 。 在 这 里 , 我 也 即将 这 么 做 ， 如 
果 你 宁可 继续 戴 着 乐观 的 眼镜 ， 那 现在 就 戴 上 它们 ， 跳 过 这 个 Hack， 选 择 另 外 一 个 Hack ( 我 建 
议 你 选择 更 令 人 愉快 的 话题 ， 比 如 赢得 大 富 伟 [Hack #51] )。 

我 选择 科学 性 ， 并 把 世界 视 为 理性 的 ， 建立 在 遵循 因果 链 的 结果 之 上 。 我 的 问题 是 ( 如果 你 
和 我 具有 相同 的 思考 方式 ， 也 许 你 的 也 一 样 )， 当 我 面 对 异 常 ( 很 难 解释 的 ， 意 想不到 的 事情 ) 
时 , 很 容易 把 异常 发 生 作 为 某 种 神秘 的 、 超 自然 的 或 某 种 意义 上 超出 科学 已 知 范围 的 证 据 。 巧 合 
是 一 个 很 好 的 例子 。 当 我 看 到 一 个 令 人 难以 置信 的 巧合 时 , 我 忍 不 住 就 陷入 非 科 学 解释 的 舒适 的 
坑 里 ， 如 命运 或 共 时 性 ( synchronicity )。 



















































































共 时 性 是 开创 性 心理 医生 卡尔 . 荣 格 ( Carl Jung ) 提出 的 术语 ， 代 表 个 人 的 有 意义 
的 巧合 。 他 把 它们 视 作 对 无 意识 内 心 世 界 的 洞察 但 不 排除 用 伪 神 秘 去 解释 它们 。 
他 不 是 一 个 统计 学 家 。 
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我 解决 问题 的 方案 是 : 思考 一 下 ， 并 应 用 概率 的 一 些 基 本 规则 ( 也许 这 也 是 你 的 解决 方案 ， 
如 果 你 依然 和 我 一 样 思考 )。 这 样 一 来 ， 我 可 以 掌握 真实 情况 ， 考 虑 到 存在 于 宇宙 中 的 大 样本 ， 
把 此 类 巧合 视 为 是 不 可 避免 的 。 通 过 应 用 这 些 规则 , 我 对 我 生活 的 世界 感觉 更 好 了 。 我 可 以 在 几 
率 的 怀 里 安然 人 睡 ， 我 不 需要 神秘 的 、 神 奇 的 解释 。 这 里 有 3 种 策略 可 供 你 应 对 下 一 个 遇 到 的 惊 
人 巧合 。 
































6.2.1 比较 可 能 结果 的 数量 


当 我 还 是 个 孩子 时 , 我 曾经 在 漫画 书 上 看 到 一 则 广告 ( 如 ，Statboy 和 他 的 名 叫 Parameter 的 飞 
天 狗 )。 这 则 广告 推销 改变 后 的 美国 便士 ,便士 不 仅 包括 标准 的 林肯 肖像 ， 另 外 还 有 约翰 . F. 肯 
尼 迪 的 肖像 。 有 一 长 串 清单 列 出 了 这 两 位 总 统 共 有 的 “ 令 人 瞩目 的 ”巧合 ， 以 便 解 释 他 们 应 该 放 
在 一 起 的 原因 ( 而 且 , 我 记得 ， 如 果 我 购买 一 整套 便士 , 我 甚至 会 得 到 一 张 小 海 报 , 海报 上 列 出 
了 这 些 相似 点 )。 


该 清单 不 仅 包括 显而易见 的 事实 ， 比 如 两 个 人 都 被 暗杀 , 继任 者 都 是 名 为 约翰 逊 的 副 总 统 , 还 
包括 了 一 些 其 他 事实 。 我 可 以 ( 的确 ) 把 这 些 巧 合 解释 为 两 者 之 间 某 种 重要 的 、 有 神奇 联系 的 证 据 。 
让 我 们 以 这 些 巧合 为 例 ， 将 其 作为 一 个 研究 问题 : 这 两 位 总 统 之 间 是 否 存在 不 寻常 的 相似 点 ? 












































我 现在 突然 想起 来 ， 当 时 那 本 漫画 书 上 的 广告 促使 我 思考 了 一 段 时 间 ， 巧合 
( coincidence ) 一 词 源 于 单词 硬币 (coin )，。 当 然 ， 我 很 快 就 明白 了 (肯定 是 通过 研 
究 生 院 )， 这 也 只 是 一 种 巧合 。 





当 判 断 一 个 巧合 是 否 令 人 瞩目 或 是 否 可 预见 时 , 有 一 个 工具 可 供 使 用 , 那 就 是 计算 可 能 的 结 
果 数 ， 然 后 判断 给 定 的 结果 (巧合 ) 是 否 会 偶然 发 生 。 这 是 预测 一 群 人 中 ,是否 有 人 同一 天 生日 
所 用 到 的 方法 [Hack #45]。 

表 6-1 的 第 一 列 介 绍 了 在 那些 老 漫画 书 广告 以 及 一 些 “ 难 以 置信 ”的 出 版 物 中 列 出 的 一 些 巧 
合 。 第 二 列 是 一 个 简短 的 清单 ， 列 出 这 俩 人 可 能 相同 、 实 际 却 不 同 的 特征 
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表 6-1: 比较 亚伯拉罕 林肯 和 约翰 F. 衣 尼 迪 





一 些 惊人 的 巧合 一 些 不 起 眼 的 非 巧合 
两 人 都 被 暗杀 身高 不 同 
都 在 60 岁 当选 体重 不 同 











刺杀 肯尼迪 的 人 从 仓库 中 开 枪 , 隐藏 在 剧院 里 ; 刺杀 林 ”他 们 死 时 年 龄 不 同 (尽管 他 们 出 生 时 同龄 ) 
肯 的 人 在 剧院 里 开 枪 ， 隐藏 在 仓库 ( 嗯 ， 至 少 是 谷 仓 ) 


林肯 在 福特 剧院 被 刺杀 ;肯尼迪 在 福特 车 中 被 刺杀 他 们 的 出 生年 份 和 日 期 不 同 
两 人 都 在 星期 五 被 刺身 两 人 的 中 间 名 不 同 
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( 续 ) 
一 些 惊人 的 巧合 一 些 不 起 眼 的 非 巧合 
两 人 都 坐 在 妻子 旁边 被 刺身 亡 两 人 的 妻子 有 不 同 的 姓名 ， 可 能 还 有 不 同 尺码 的 鞋子 
两 人 的 继任 都 叫 约翰 逊 两 继任 者 的 全 名 不 同 
林肯 留 着 胡子 ， 肯 尼 迪 没有 (我 想起 来 了 ， 他 们 的 脸型 非常 
不 同 ) 
肯尼迪 偶尔 可 能 会 打 保龄球 ， 林 肯 一 生 从 未 打 过 一 场 保龄球 
比赛 
如 果 只 注意 林肯 和 肯尼迪 之 间 相 对 较 少 的 一 致 性 〈 命 中 )， 而 忽略 所 有 的 、 几 乎 无 限 多 的 不 
一 致 〈 非 命中 )， 就 很 容易 误 以 为 存在 一 些 不 可 思议 的 连接 。 当 然 ， 依 然 可 能 存在 一 些 不 可 思议 


的 连接 , 但 “巧合 ”无 法 为 它 提供 证 据 。 


6.2.2 ” 找 出 实际 几率 


如 果 你 遵守 任意 一 种 规则 去 玩 扑 克 牌 ( 如 果 你 是 一 位 名 气 不 大 的 好 莱 坞 名 人 , 你 显然 一 直 在 
打牌 )， 知 道 自己 很 少 会 看 到 皇家 同花顺 : 同一 花色 的 10、J、Q、K、A， 共 5 张 牌 。 如 果 你 的 对 
手 被 发 到 了 一 个 皇家 同花顺 , 那 会 引 人 注 目 吗 ?你 会 怀疑 他 作 潍 了 吗 ? 这 取决 于 你 一 生 中 共 看 到 
多 少 扑克 手 牌 ， 或 你 最 近 看 到 了 多 少 手 牌 。 

证 我 们 用 简单 的 5 张 牌 做 数学 运算 。 为 了 计算 发 出 的 5 张 牌 形成 同花顺 的 几率 , 我 们 先 计 算出 可 
能 的 5 张 手 牌 数 ， 并 和 那些 被 定义 为 皇家 同花顺 的 手 牌 组 合 数 进行 比较 。 这 个 过 程 需要 3 步 。 

(D 考虑 扑克 牌 的 顺序 ， 计 算 可 能 的 手 牌 组 合 数 。 我 们 以 这 种 方式 开始 是 因为 这 样 的 数学 计 
算 最 容易 。52 张 牌 中 的 任意 一 张 都 可 能 成 为 第 一 张 发 出 的 牌 , 然后 剩余 51 张 中 的 任意 一 张 都 可 能 
是 下 一 张 发 出 的 牌 , 再 然后 剩余 50 张 手 牌 中 的 任意 一 张 , 以 此 类 推 , 直到 48 张 手 牌 中 的 任意 一 张 。 
所 以 ， 当 顺序 有 影响 时 ， 可 能 的 手 牌 数 是 : 
32x31x350x49x48=311 873 200 


(2) 但 是 ， 顺 序 无 关 紧 要 。 所 以 ， 我们 用 这 个 巨大 的 、 所 有 可 能 的 手 牌 总 数 除 以 可 能 的 不 同 

序列 数 。 不 同 序列 数 是 5 x 4x3 x2x1=120， 所 以 可 能 的 5 张 扑 克 手 牌 数 是 : 
311 875 200/120=2 598 960 

(3) 因为 只 有 4 种 花色 ， 所 以 只 有 4 种 可 能 的 皇家 同花顺 ， 我 们 用 这 个 积极 的 结果 (4 ) 除 以 可 
能 结果 数 (2 598 960 )， 概 率 是 0.000 001 539， 即 1/649 740。 

每 经 历 649 740 次 手 牌 ， 你 的 对 手 或 你 能 被 发 到 皇家 同花顺 的 $ 张 牌 。 所 以 ， 如 果 它 确实 发 生 
了 , 那 肯 定 是 罕见 的 。 如 果 它 在 同一 场 比赛 中 不 止 一 次 发 生 , 你 应 该 把 它 解释 为 非常 惊人 的 巧合 
或 是 作 粗 的 证 据 。 你 自己 来 决定 是 将 其 看 为 巧合 还 是 作弊 。 我 只 知道 我 的 计算 和 自己 的 猜测 。 
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_ ”怎么 能 发 到 皇家 同花顺 ? 毕竟 ， 在 纸牌 游戏 和 得 州 扑克 中 ， 玩 家 有 机 会 改善 他 们 的 
鼠 手 牌 或 至 少 把 它 引 向 菜 个 目标 。 在 发 牌 中 ， 如 果 你 有 4 张 牌 能 组 成 皇家 同花顺 ， 并 
希望 放弃 第 五 张 牌 而 抽取 一 张 新 牌 ， 你 有 1/47 的 成 功 几率 ， 或 0.021 个 百分点 。 如 果 

你 有 两 次 机 会 来 提高 你 的 手 牌 ， 几 率 就 上 升 至 0.043%， 即 约 每 25 次 尝试 成 功 1 次 。 


6.2.3 ” 移 除 分 配给 无 意义 事件 的 意义 


当 必 须 赋 予 数据 意义 时 ， 人 类 的 大 脑 处 于 最 佳 状 态 。 我 们 令 人 瞩目 的 智慧 甚至 可 以 在 没有 意 
义 的 情况 下 找 出 意义 。 通 常情 况 ， 我 们 会 认为 自己 见证 了 一 系列 巧合 奇迹 。 当 我 们 寻找 巧合 时 ， 
我 们 就 能 看 到 巧合 。 

非常 不 可 能 的 事件 一 直 在 发 生 : 每 一 天 、 每 一 小 时 , 其 至 每 一 分 钟 。 对 于 非常 不 可 能 的 事件 ， 
只 有 当 我 们 认为 它们 有 趣 时 ， 它 们 才 是 有 趣 的 。 想 想 我 们 的 扑克 例子 。 因 为 有 大 约 260 万 种 可 能 
的 5 张 扑克 手 牌 ， 任 何 特定 手 牌 的 几率 约 是 1/2 600 000。 我 们 认为 有 特别 意义 的 手 牌 ， 比 如 同 是 
黑 桃 的 10、J、Q、K 和 A， 和 我 们 认为 不 具有 特别 意义 的 手 牌 ， 比 如 梅花 4、 黑 桃 6、 方 片 J]、 黑 桃 
K 和 红 桃 A， 几 率 是 一 样 的 。 为 什么 你 对 发 到 皇家 同花顺 和 任何 其 他 随机 手 牌 组 合 的 惊奇 程度 不 
同 ? 对 所 有 扑克 手 牌 来 说 ， 概 率 是 相同 的 。 我 们 对 特定 的 结果 赋予 了 意义 。 


下 一 次 ,你 在 一 个 拥挤 的 地 方 ( 如 ， 棒 球 比赛 场 、 游 乐园 或 机 场 ) 遇 到 某 个 认识 的 人 ,你 认 
为 这 种 巧合 有 意义 只 是 因为 你 碰巧 认识 这 个 人 。 是 的 ， 你 会 遇 到 某 个 特定 的 人 【除非 你 被 跟踪 ) 
的 几率 非常 渺茫 ， 但 你 100% 会 遇 到 其 他 人 。 所 有 其 他 人 只 是 碰巧 与 你 在 相同 时 间 出 现在 相同 地 
点 。 它 是 一 个 巧合 , 个 体 的 这 种 特定 组 合 在 同一 个 时 间 同 一 地 点 发 生 是 非常 不 可 能 的 。 但 是 ,这 
对 你 来 说 不 是 一 个 有 意义 的 巧合 。 



























































如 果 我 们 算 上 你 认识 的 每 一 人 , 那么 你 遇 到 熟人 的 几率 会 更 高 。 比方 说 , 你 认识 200 

肛 人 ， 你 茶 天 晚上 自己 去 堪萨斯 城 皇家 队 看 棒球 比赛 。 如 果 那 200 个 人 每 人 每 赛季 去 
看 一 次 皇家 队 比 赛 ， 每 个 赛季 有 81 场 主场 比赛 ，200 人 中 每 个 人 有 1/81 的 几率 和 你 
在 同一 个 晚上 出 现在 那里 。 那 个 时 候 你 不 太 可 能 会 遇 到 特定 的 人 ， 比 如 你 的 叔叔 弗 
兰 克 ， 但 那里 非常 可 能 有 你 认识 的 人 。 大 约 有 92% 的 几率 ， 你 200 个 好 友 中 的 一 个 
或 多 个 会 在 那里 ， 即 使 他 们 每 个 人 都 很 少 去 看 比赛 。 即 使 你 只 认识 56 个 人 ， 这 36 人 
中 的 一 个 或 多 个 出 现在 那里 的 几率 也 是 大 于 50% 的 。 


我 们 每 天 都 经 历 大 量 事 件 ， 人 和 事 以 非常 不 可 能 的 方式 交互 和 巧合 。 有 时， 这些 巧合 对 我 们 
有 意义 ,所 以 我 们 注意 到 它们 。 但 令 人 诺 异 的 是 , 我 们 没有 花费 更 多 的 时 间 关 注 这 些 非常 不 可 能 
的 事件 。 
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0 6.3 识别 生活 中 真正 的 随机 
l i 有 iB】 在 你 指责 财 声 经营 不 正当 的 赌博 , 芭 版 胁 你 的 老板 你 将 起 诉 他 只 诬 仙 白 肤 金 发 歼 距 的 
女人 之 前 ， 这 里 有 一 个 工具 ， 可 用 来 分 离 那些 看 起 来 非 获 机 但 可 能 获 机 的 情境 以 及 
那些 看 起 来 非 随机 但 可 能 没有 随机 发 和 主 约 情境 。 也 许 吧 。 








随 着 你 越 来 越 深刻 地 意识 到 几率 在 你 周围 世界 扮演 着 重要 角色 , 你 开始 习惯 性 地 对 每 天 的 情 
境 进行 统计 分 析 ， 并 可 能 对 看 起 来 不 正确 的 模式 过 于 敏感 。 但 是 , 不 要 滥用 你 新 发 现 的 力量 , 把 
概率 视 为 确定 性 。 此 外 ， 不 要 错误 地 期 望 人 们 认为 随机 的 事件 看 起 来 也 是 随机 的 。 











6.3.1 随机 是 怎样 的 


看 起 来 随机 和 真正 的 随机 是 不 一 样 的 。 当 事件 有 不 同 的 可 能 结果 , 而 每 个 结果 有 等 同 的 发 生 几 
率 时 ， 其 中 任何 一 个 都 有 可 能 发 生 。 但是， 人们 的 一 般 思 维 是 ， 有 若干 同 几率 结果 的 事件 ,其 最 终 
结果 应 该 看 起 来 是 某 种 方式 ， 在 一 定 程度 上 ， 这 种 方式 看 起 来 也 是 随机 的 〈 不 管 那 意 味 着 什么 )。 

举例 来 说 , 现实 世界 的 研究 发 现 ， 人 们 往往 认为 翻转 硬币 时 , 最 可 能 的 结果 是 那些 看 起 来 最 
为 混杂 的 结果 。 为 了 说 明 这 个 观念 , 请 看 表 6-2。( 在 没 进行 深入 阅读 前 , 不 要 看 表 6-3 ) 你 认为 哪 
个 确切 的 顺序 最 有 可 能 发 生 ? 












































表 6-2: 硬币 翻转 模式 (不 显示 概率 ) 



































答 ” 案 正面 和 反面 的 模式 概 率 
A 正面 、 反 面 、 正 面 、 正 面 、 反 面 ? 
B 反面 、 反 面 、 反 面 、 反 面 、 反 面 ? 
C 正面 、 正 面 、 反 面 、 反 面 、 反 面 ? 
D 正面 、 正 面 、 正 面 、 正 面 、 反 面 ? 








很 多 人 给 出 的 答案 是 “A”。 也 许 你 给 出 的 也 是 这 个 答案 。 当 被 要 求解 释 为 什么 A 看 起 来 是 最 
可 能 出 现 的 结果 时 ， 可 能 有 以 下 这 样 的 解释 。 
口 “ 其 他 的 都 太 有 顺序 了 。” 
口 “A 更 混杂 ， 所 以 它 的 可 能 性 比较 大 。” 
口 “A 看 起 来 更 随机 ， 就 像 它 可 能 真 的 会 发 生 一 样 。 

即使 你 知道 抛 硬币 是 随机 的 ( 假设 硬币 没有 被 加 重 )， 看 起 来 随机 并 不 使 得 某 事 更 有 可 能 。 
所 有 这 些 抛 重 币 的 模式 实际 上 具有 同样 的 可 能 性 ， 如 表 6-3 中 的 数学 所 示 。 

















6.3 ”识别 生活 中 真正 的 随机 221 





表 6-3: 抛 硬币 模式 (显示 概率 ) 


























答案 正面 和 反面 的 模式 概 军 

A 正面 、 反 面 、 正 面 、 正 面 、 反 面 1/2 x 1/2 x 1/2 x 1/2 x 1/2=1/32=0.031 25 
B 反面 、 反 面 、 反 面 、 反 面 、 反 面 1/2 x 1/2 x 1/2 x 1/2 x 1/2=1/32=0.031 25 
C E 面 、 正 面 、 反 面 、 反 面 、 反 面 1/2 x 1/2 x 1/2 x 1/2 x 1/2=1/32=0.031 25 
D E 面 、 正 面 、 正 面 、 正 面 、 反 面 1/2 x 1/2 x 1/2 x 1/2 x 1/2=1/32=0.031 25 


























当 被 要 求 预测 抛 一 系列 硬币 的 特定 结果 时 , 所 有 可 能 的 结果 一 定 是 相同 概率 的 , 因为 每 次 抛 
人 硬币 都 是 相互 独立 的 。 换言之 , 硬币 不 知道 它 上 一 次 是 头 着 地 还 是 尾 着 地 , 硬币 也 没有 办 法 知道 
它 下 一 次 被 抛 出 时 哪 一 面 着 地 。 一 枚 硬币 ， 像 角 子 或 轮 盘 赌 一 样 ， 没 有 记忆 。 








6.3.2 ”如 何 识 别 随机 结果 


当 你 看 到 不 同 寻 常 的 事件 时 , 想 要 知道 它 是 否 为 不 寻常 的 事件 , 你 需要 确定 你 关注 的 是 组 合 
还 是 排列 。 在 概率 论 中 ,我 们 讨论 概率 的 计算 时 要 分 清 是 某 种 组 合 的 概率 ( 例如 ， 以 任何 顺序 出 
现 的 3 个 正面 和 2 个 反面 ), 还 是 某 种 排列 的 概率 (会 产生 3 个 正面 和 2 个 反面 的 确切 序列 ， 如 正面 、 
有 反面、 正面、 正面、 反面 ， 以 这 个 特定 顺序 出 现 )。 

如 果 你 被 问 到 ,哪个 结果 是 最 有 可 能 的 ,或 一 个 给 定 结果 是 否 可 能 偶然 发 生 ， 首 先 要 确定 你 
被 问 的 是 可 能 的 组 合 ( 例如， 以 任何 顺序 出 现 正面 和 反面 的 总 数 , 或 是 以 不 同方 式 发 到 相同 花色 
的 5 张 牌 的 总 数 ) 还 是 可 能 的 排列 。 下 面 是 两 者 的 重要 区 别 。 

@ 组 合 


组 合 是 指 当 从 某 个 总 体 中 随机 抽取 时 , 能 使 结果 达到 某 个 特定 数值 的 总 方法 数 。 硬币 翻转 就 
是 从 由 50% 正 面 和 50% 反 面 构成 的 、 理 论 上 无 限 大 的 总 体 中 抽取 的 样本 。 组 合 的 数量 会 有 变化 ， 
这 取决 于 感 兴 趣 的 特定 值 的 数量 。 换 句 话 说， 对 于 抽 5$ 张 牌 或 翻转 硬币 ， 抽 到 3 张 人 头 牌 的 方法 比 
抽 到 5 张 人 头 牌 方法 要 多 。 因 此 ， 抽 到 3 张 人 头 牌 比 抽 到 5$ 张 人 头 牌 更 有 可 能 。 

e@ 排列 

排列 是 指 给 定数 量 的 元 素 能 以 多 少 种 方式 排列 。 换 句 话 说， 它们 是 精确 的 序列 数 。 在 我 们 的 
硬币 翻转 例子 中 ，5 个 元 素 ， 每 个 元 素 都 有 2 种 可 能 ， 进 而 导致 32 种 不 同 的 可 能 顺序 结果 。 所 以 ， 
表 6-3 所 示 的 每 个 排列 会 发 生 的 几率 是 1/32。 






















































































6.3.3 ”如 何 计算 组 合 


可 能 的 组 合 数量 是 通过 把 抽取 的 可 能 值 的 数目 〈 例 如， 一 枚 硬币 有 2 个 值 : 正面 或 反面 ), 在 
每 次 抽取 时 和 它 自身 相 乘 得 出 : 
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值 的 数量 
5 次 硬币 翻转 ， 有 32 种 可 能 的 组 合 ( 2; )。 
从 总 体 中 抽取 特定 元 素 的 特定 值 ( 如 3 个 正面 ) 的 方法 数 ， 计 算 方 程 如 下 : 


nl 


rl(n—r)! 
这 个 方程 ， 需 要 这 些 变 量 : 
n ”元 素 或 抽取 的 数量 ( 例如 ，5 次 硬币 翻转 )。 
r+ ” 感 兴 趣 的 特定 抽取 (例如 ，3 个 正面 )。 
! ”阶乘 , 表示 这 个 数 乘 以 比 此 数 小 1 的 数 ， 然 后 乘 以 比 此 数 小 2 的 数 , 依 此 类 推 ,， 直 到 最 后 
乘 以 1。 例 如 ，5! 代表 5 x4 x3x2x1=120 (顺便 说 一 下 ， 这 就 是 在 扑克 手 牌 中 ， 为 什 
么 5$ 张 牌 有 120 种 可 能 组 合 [Hack #62] )。 


那么 ，5 次 硬币 翻转 获得 3 个 正面 的 方式 数 为 : 
5! 120 120 
3!(5—3)! 6(20) 12 
32 种 可 能 的 组 合 中 选 出 10 种 组 合 ， 意 味 着 你 通过 5 次 抛 硬币 正好 得 到 3 个 正面 的 几率 是 10/32， 
或 约 31%。 
































=10 





在 一 个 荒 鸟 上 进行 统计 黑客 
如 果 你 在 一 个 荒 岛 上 , 没有 书籍 或 方程 方法 , 但 必须 找 出 5 次 硬币 翻转 中 正好 出 现 3 次 正面 
的 频率 是 多 少时 , 你 可 以 使 用 粗略 近似 的 方法 : 把 所 有 可 能 的 翻转 模式 列 出 来 ， 并 数 出 它们 之 
中 有 多 少 正 好 有 3 个 正面 。 它 会 如 下 面 这 样 ， 符 合 要 求 的 结果 (3 次 正面 ) 以 粗 体 显 示 : 
HHHHH THHHH HHHHT THHHT HHTTHTHTTH HHTTT THTTT HHHTH THHTH 
HHHTT THHTT HHTHH THTHH HHTHT THTHT HTHHH TTHHH HTHHT TTHHT HTTTH 
TTTTH HTHTT TTHTT HTTHH TTTHH HTTTT TTTTT HTHTH TTHTH HTTHT TTTHT 








6.3.4 ”什么 时 候 需 持 怀 疑 态度 
判断 一 个 模式 是 否 随机 ( 即 ， 什 么 被 期 望 为 偶然 出 现 的 ), 需要: 


口 知道 某 种 组 合 的 几率 〈 不 是 排列 ); 
口 克服 “期 望 随机 结果 不 会 产生 可 识别 模式 ”的 心理 预期 ; 
D 在 质疑 数据 前 ， 设 置 事件 需 达 到 的 不 可 能 发 生 的 概率 标准 。 
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让 我 们 回 到 硬币 翻转 表 ， 现 在 表 6-4 新 增 了 感 兴趣 的 结果 概率 。 
表 6-4: 硬币 翻转 结果 和 概率 





















































顺序 顺序 概率 结果 结果 概率 
正面 、 反 面 、 正 面 、 正 面 、 反 面 0.031 25 3 个 正面 0.312 50 
反面 、 反 面 、 反 面 、 反 面 、 反 面 0.031 25 5 个 反面 0.031 25 
正面 、 正 面 、 反 面 、 反 面 、 反 面 0.031 25 3 个 反面 0.312 50 
正面 、 正 面 、 正 面 、 反 面 、 正 面 0.031 25 4 个 正面 0.156 25 




















这 些 结果 中 ， 最 稀有 的 是 5 个 正面 ，5 枚 硬币 翻转 ，100 次 中 会 有 3 次 出 现 5 个 正面 。 在 一 个 给 
定 的 尝试 下 ,这 不 太 可 能 发 生 , 但 在 一 系列 尝试 中 ,， 它 偶尔 会 发 生 。 如 果 在 一 系列 的 尝试 中 经 常 
发 生 ， 其 中 一 定 有 某 种 原因 。 

你 习惯 什么 水 平 的 可 能 性 ”事件 得 有 多 罕见 , 你 才能 判断 其 不 是 偶然 发 生 的 ? 科学 家 们 已 设 
定 了 5% 的 标准 。 如 果 研 究 表明 ， 这 个 结果 偶然 出 现 的 几率 只 有 5% 或 更 少 ， 那 它 通常 被 认为 是 显 
著 ， 可 能 作为 有 几率 以 外 的 因素 在 起 作用 的 证 据 。 

不 过 ， 当 你 想 指 责 某 人 是 骗子 时 ， 你 必须 自己 决定 。 祝 你 做 决定 时 好 运 ! 它 导 致 打架 的 几率 
应 该 小 于 5%。 











一 一 吉尔 ， 罗 米尔 和 布 曾 斯 ， 弗 雷 


WE 6.4 ”识别 伪造 数据 
l 如 果 你 之 前 没有 对 数字 进行 太 多 思考 ,你 可 能 很 自然 地 假设 在 最 随机 的 数据 集中 ,所 有 
数字 出 现 的 可 能 性 等 同 。 但 根据 本 福特 定律 , 对 于 许多 类 型 的 自然 发 主 的 数据 , 数字 越 
小 ， 它 以 首位 数 出 现 的 频率 越 高 。 你 可 以 用 这 个 秘密 知 识 未 检验 任何 数 据 集 的 真实 性 。 


在 电子 计算 器 时 代 远 未 到 来 的 19 世 纪 , 科学 家 利用 出 版 书籍 里 的 表格 发 现 了 对 数 的 值 。 一 位 
特别 细心 的 19 世 纪 天 文学 家 、 数 学 家 西蒙 ' 纽 科 姆 ( Simon Newcomb ) 发 现 ， 含 有 对 数 表格 的 页 
面 ， 其 前 几 页 比 后 几 页 更 加 破旧 。 纽 科 姆 下 结论 ， 以 1 开头 的 数字 出 现 的 频率 比 以 2 开头 的 数字 更 
高 ， 以 2 开头 的 数字 出 现 的 频率 比 以 3 开头 的 数字 更 高 ， 以 此 类 推 。 

根据 他 的 观测 ， 纽 科 姆 于 1981 年 在 《美国 数学 杂志 》( American Journal of Mathematics ) 上 
发 表 了 实证 结果 ， 其 中 阐述 了 许多 类 型 的 自然 产生 数据 的 概率 ， 数据 以 4 开头 ，d4=1,2,…,9。 纽 科 
姆 的 首位 有 效 数 法 则 ( firstsignificant digit law ) 几乎 不 被 关注 ， 在 很 大 程度 上 甚至 被 遗忘 了 ， 直 
到 50 年 后 ， 就 职 于 通用 电气 公司 的 物理 学 家 富 兰 克 ，. 本 福特 ( Frank Benford )， 注 意 到 了 同样 的 
对 数 表 破 损 模 式 。 

经 过 对 大 量 数据 的 广泛 测试 (20 229 个 观测 结果 ) 包括 原子 量 、 河 流 的 排水 区 、 人 口 普 
查 数 字 、 棱 球 统计 数据 和 财务 数据 ， 本 福特 将 首位 有 效 数字 概率 定律 发 表 在 美国 哲学 会 的 会 议 记 
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录 上 (本 福特 ，1938 )。 这 一 次 ， 首 位 有 效 数字 法 则 吸引 了 更 多 的 关注 ， 被 称 为 本 福特 定律 。 尽 
管 文 章 于 1938 年 发 表 后 ， 本 福特 定律 变 得 众所周知 ， 且 其 中 包括 大 量 的 统计 证 据 , 但 它 缺 乏 一 个 
严谨 的 数学 基础 ， 直 到 1996 年 ， 佐 治 亚 理 工学 院 的 数学 教授 西 奥 多 : 希 尔 ( Theodore Hill ) 才 提 
供 了 严谨 的 数学 证 明 ( 希 尔 ，1996 )。 


今天 , 本 福特 定律 在 多 个 自然 产生 数据 的 领域 中 有 着 常规 的 应 用 。 也许 本 福特 定律 最 实际 的 
应 用 是 检测 会 计 中 的 欺诈 数据 ( 或 无 意 的 错误 )， 由 对 迈克 尔 学 院 ( Saint Michael’s College ) 工商 
管理 和 会 计 系 的 教授 马克 … 内 格 罗 尼 ( Mark Nigrini ) 率先 应 用 ( http://www.nigrini.com/ )。 


伪造 数据 的 检测 不 仅 在 会 计 中 非常 重要 ,而且 在 各 种 各 样 的 其 他 应 用 中 也 很 重要 ( 例如 , 在 
药物 测试 的 临床 试验 中 )。 本 Hack 介 绍 了 本 福特 定律 ， 告 诉 你 如 何 应 用 它 ， 提 供 了 一 些 直观 理由 
证 明 其 有 效 性 ， 并 给 出 说 明 什 么 时 候 能 运用 本 福特 定律 的 指导 原则 。 
































6.4.1 如 何 生 效 


在 最 简单 的 形式 中 ,本 福特 定律 指出 ,在 许多 自然 产生 的 数字 型 数据 中 ,第 一 个 〈 非 零 ) 有 
效 数字 的 分 布 遵循 对 数 概率 分 布 ， 如 下 所 示 。 沿用 希 尔 的 用 法 ( 1997 ), 令 D(x) 表示 十 进 制 数字 
x 的 首位 有 效 数字 。 例 如 ，D(9108)=9，D(0.025708)=2。 


然后 ,根据 本 福特 定律 ，Di(x) = d 的 概率 可 按 下 式 计算 ,其 中 4 可 以 等 于 1,2,3,…,9: 














1 
PLD =d)= logo 1 十 
这 样 ， 表 6-5 给 出 了 首位 有 效 数 字 的 概率 。 


表 6-5: 本 福特 定律 下 的 首位 有 效 数 字 的 概率 


第 一 个 非 零 数字 本 福特 定律 下 的 概率 
0.301 
0.176 
0.125 
0.097 
0.079 
0.067 
0.058 
0.051 
0.046 





Ko 


6.4.2 ”验证 定律 
为 了 证 明 本 福特 定律 ， 我 会 考虑 两 个 你 可 以 自行 验证 的 例子 。 
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1. 街道 地 址 


付 诸 行动 验证 本 福特 定律 , 打开 你 所 在 城 








和 或 城镇 的 电话 短 ， 翻 到 任何 一 页 ， 记 录 下 以 非 零 





开头 的 每 个 十 进 制 数 门牌 号 码 。 两 页 就 足够 了 。 除 非 你 所 在 的 城镇 有 些 不 寻常 ,不 然 相对 频率 应 





和 通过 本 福特 定律 预测 的 概率 相似 。 








表 6-6 显 示 了 413 个 家 庭 门牌 号 码 的 计算 结果 ， 








号 人 码 取 自 2005 年 至 2006 年 Narragansett/ 


Newport/Westerly 这 一 地 区 的 RI 黄皮书 ( 白 页 部 分 ) 中 的 两 页 。 


表 6-6: 遵循 本 福特 定律 的 地 址 





首 个 非 零 数字 门牌 号 首 个 数字 的 相对 频率 基于 本 福特 定律 的 概率 
1 0.334 0.301 
2 0.174 0.176 
3 0.143 0.125 
4 0.075 0.097 
5 0.073 0.079 
6 0.075 0.067 
7 0.046 0.058 
8 0.043 0.051 
9 0.036 0.046 





图 6-1 更 清楚 地 展示 了 这 个 模式 。 








0.357 


相对 频率 /概率 


0. 人 

















(413 个 门牌 

















号 ) 首 个 数字 的 相对 


频率 与 本 福特 定律 的 比较 


























地 址 敌 
本 福特 



























































Wu 


中 


首 个 数字 











遵循 本 福特 定律 的 街道 地 址 

















虽然 实际 情况 和 本 福特 定律 不 完全 一 致 , 但 你 可 以 看 到 一 个 合理 的 良好 匹配 。 如 果 你 采用 更 6 
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大 的 地 址 样本 ， 由 此 产生 的 相对 频率 会 更 接近 本 福特 定律 预测 的 频率 。 

2. 股票 价格 

股市 遵循 本 福特 定律 。 你 可 以 在 http://quotes.nasdaq.com/reference/comlookup.stm 上 获取 最 新 
的 纳 斯 达 克 证 券 价格 ， 进 而 自行 验证 。 
图 6-2 和 表 6-7 显 示 了 2006 年 1 月 27 日 纳 斯 达 克 证 券 第 一 个 非 零 十 进 制 数字 的 相对 频率 ,并 和 本 
福特 定律 所 预测 的 概率 进行 对 比 。 










































































































































































人 (3343 个 报价 ) 
035 与 本 福特 定律 的 
纳 斯 达 克 证 券 
03] [ 国 转 本 福特 
0.25] 
的 0.2 
宕 
长 o15 
记 
去 
0.] 
0.05] | 
0 T T T T T 
0 1 2 3 4 5 6 7 8 9 
首 个 非 零 数 字 
图 6-2: 遵循 本 福特 定律 的 股市 
表 6-7: 遵循 本 福特 定律 的 纳 斯 达 克 证 券 
首 个 非 零 数字 纳 斯 达 克 证 券 首 个 数字 的 相对 频率 根据 本 福特 定律 的 概率 
1 0.301 0.301 
2 0.167 0.176 
3 0.133 0.125 
4 0.095 0.097 
5 0.082 0.079 
6 0.071 0.067 
7 0.055 0.058 
8 0.045 0.051 
9 0.049 0.046 


6.4 识别 伪造 数据 227 





你 可 以 在 http://homepage.mac.com/samchops/benford/ 上 得 到 用 于 生成 这 部 分 表格 和 
数字 的 Matlab 代 码 。 此 外 ，Mark Nigrini 在 http://www.nigrini.com/datas_software.htm 
上 提供 了 DATAS 软 件 ( 包括 一 个 免费 的 学 生 EXCEL 程 序 )， 可 执行 对 第 一 个 、 第 二 
个 或 前 两 个 数字 的 更 复杂 的 数据 分 析 。 


6.4.3 ”本 福特 定律 更 普遍 的 应 用 
本 福特 定律 并 不 只 适用 于 首 个 非 零 数 字 , 也 同样 适用 于 其 他 数字 的 概率 。 再 次 ,遵循 我 们 之 





前 讨论 的 方式 , 令 D,(x) 表示 十 进 


而 D,(0.025108)=5 





[e 








所 数字 x 的 第 二 个 有 效 数 。 例 如 ，D,(9108) =1 、D,(9018)=0， 


注意 ,不同 于 首 个 有 效 数字 ， 第 二 个 有 效 数字 可 以 是 零 。 
然后 ， 根 据 本 福特 定律 ，D,(x) = 4 的 概率 ， 由 下 面 的 等 式 给 出 ， 其 中 d 可 以 等 于 0,1,2,…,9: 





P(D, =d)=log [ + 


i=] 


By d; x10™ ] 


这 个 公式 得 出 了 第 二 个 有 效 数 字 的 概率 ， 如 表 6-8 中 所 示 。 


表 6-8: 本 福特 第 二 数字 定律 
第 二 个 有 效 数 字 根据 本 福特 定律 的 概率 





从 表 6-8 可 以 看 出 ， 不 同 于 相应 的 首位 数字 ， 第 二 个 有 效 数字 之 间 的 概率 差异 不 那么 具有 戏 


0 0.119 68 
1 0.113 89 
2 0.108 82 
3 0.104 33 
4 0.100 31 
3 0.096 68 
6 0.093 37 
的 0.090 35 
8 0.087 57 
9 0.085 00 
剧 性 。 


现在 , 回 到 股 


条。 为 了 论证 本 福特 定 得 








的 第 二 个 有 效 数 字 的 相对 频率 。 结 果 如 表 6-9 所 示 ， 再 


致 性 。 

















和 第 二 个 有 效 数字 有 关 , 我 计算 了 之 前 纳 斯 达 克 证 券 




















次 说 明确 实 与 本 福特 定律 有 密切 的 一 
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表 6-9: 遵循 本 福特 第 二 数字 定律 的 纳 斯 达 克 证 券 





第 二 个 数字 第 二 个 数字 的 相对 频率 根据 本 福特 定律 的 概率 
0 0.128 03 0.119 68 
1 0.114 27 0.113 89 
2 0.109 18 0.108 82 
3 0.102 90 0.104 33 
4 0.102 30 0.100 31 
5 0.092 73 0.096 68 
6 0.090 64 0.093 37 
7 0.091 53 0.090 35 
8 0.084 06 0.090 35 
9 0.084 36 0.085 00 


本 福特 的 一 个 更 普遍 的 概率 公式 可 以 用 来 计算 第 n 位 的 相应 概率 。 设 D, (x) 表示 十 进 制 数字 x 
的 第 个 有 效 数字 。 然 后 ,根据 本 福特 定律 ，D (x)= 4 , D,(x)=4q,,…， 和 DD,(x)=4q, 的 概率 由 下 
面 的 公式 给 出 : 























n 5 
PD =4d,D, = qd,,…,D, -wes [1s (sam) | 
il 


注意 ,如果 不 等 于 1, 那么 和 可 以 等 于 0,1,2,…,9, 正如 前 面 所 指出 的 ，d 可 以 等 于 1,2,…, 9。 





6.4.4 其 他 生效 领域 

本 福特 定律 的 两 个 独特 性 质 是 尺度 不 变性 和 底数 不 变性 。 

1. 尺度 不 变性 

本 福特 定律 的 尺度 不 变性 是 指 , 如 果 你 用 某 个 数 乘 以 任何 非 零 的 常数 , 你 依然 会 得 到 接近 于 
遵循 本 福特 定律 的 分 布 。 因 此 ， 你 以 美元 、 第 纳 尔 : 或 谢 克 尔 “ 衡 量 股票 的 报价 ， 以 英里 或 公里 测 
量 河流 的 长 度 ， 都 没有 区 别 。 你 最 后 总 是 会 得 到 遵循 本 福特 定律 的 数据 。 

为 了 证 明 这 一 点 ， 我 使 用 前 面 例子 中 的 纳 斯 达 克 证 券 数 据 ， 把 每 个 值 都 乘 以 p。 正 如 你 在 表 
6-10 中 看 到 的 那样 ， 相 对 频率 仍 遵循 本 福特 定律 。 










































































注 1: 第 纳 尔 是 南斯拉夫 、 伊 拉克 及 阿尔 及 利 亚 等 国 的 货币 单位 。 一 一 译 者 注 
注 2: 古 希 伯 来 或 巴比伦 的 度量 单位 和 钱币 。 一 一 译 者 注 
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表 6-10: 遵循 本 福特 定律 的 扩大 后 的 纳 斯 达 克 证 券 





首 个 非 零 数字 纳 斯 达 克 证 券 首 个 数字 的 相对 频率 根据 本 福特 定律 的 概率 
1 0.306 0.301 
2 0.176 0.176 
3 0.123 0.125 
4 0.097 0.097 
5 0.081 0.079 
6 0.066 0.067 
7 0.058 0.058 
8 0.049 0.051 
9 0.045 0.046 


2. 底数 不 变性 


本 福特 定律 的 底数 不 变性 是 指 ， 它 不 仅 适 月 
西 奥 多 ' 希 尔 发 现 ， 本 福特 定律 是 唯一 具有 这 一 和 











于 底数 10， 而 且 还 适用 于 更 一 般 的 底数 。 此 外 ， 
FE 质 的 概率 定律 ( 希 尔 ，1995 )。 


i 你 可 以 在 希 尔 ( 1997 ) 论著 里 找到 一 般 底数 的 本 福特 定律 公式 。6.4.7 节 有 关于 此 出 
版 物 的 详细 说 明 。 














数据 具有 以 下 特点 时 ， 本 福特 定律 的 效果 最 佳 。 


@ 足够 的 可 变性 








该 变异 越 高 ， 本 福特 定律 的 运用 效果 越 好 。 
@ 无 内 置 最 大 值 或 其 他 类 似 的 约束 


例如 ， 本 福特 定 但 





并 不 适用 于 高 年 级 学 生 的 年 龄 ， 或 当 ] 





@ 数字 来 自 于 计数 或 测量 
例如 ， 它 不 适用 于 社会 安全 号 码 和 邮政 编码 ， 因 为 它们 是 简单 的 识别 码 ， 不 是 真正 的 数值 。 





@ 大 样本 





地 老年 人 中 心 的 成 员 。 








数据 集 越 大 ， 本 福特 定律 的 运用 效果 越 好 。 


e@ 随机 抽样 





数据 来 自 于 大 量 的 、 随 机 选中 的 、 符 合 概率 分 布 的 随机 样本 。 随 机 抽样 的 实现 为 希 尔 证 明 本 
福特 定律 提供 了 有 力 的 支撑 (贝克 尔 ，2000; 希 尔 ，1999 )。 


由 于 税收 数据 很 好 地 遵循 本 福特 定律 , 所 以 这 一 定律 已 经 十 分 成 功 地 用 于 识别 虚假 的 纳税 申 


报 。 在 描述 本 福特 定律 的 一 些 基本 特 生 








F 时 ,我 们 展示 了 如 何 对 数据 的 违规 行为 进行 迅速 旦 随意 的 
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检验 。 具 体 来 说 ,任何 人 都 可 以 很 容易 地 计算 第 一 个 数字 的 相对 频率 ,把 这 个 结果 和 由 本 福特 定 
律 预测 的 结果 放 在 一 起 ， 并 进行 仔细 的 对 比 检查 。 

在 实际 应 用 中 , 专家 和 权威 人 士 使 用 的 、 用 来 确认 偏离 本 福特 定律 结果 以 及 其 他 违规 行为 的 
程序 是 相当 复杂 的 。 与 本 福特 定律 存在 偏差 并 不 能 证 明 存在 欺诈 行为 ， 但 它 确实 给 出 了 显著 性 ， 
提示 需要 进一步 调查 ， 记 住 这 点 也 同样 重要 。 















































你 可 参看 内 格 罗 尼 ( 1996 ) 了 解 更 多 利用 本 福特 定律 发 现 舞 弊 的 细节 , 其 中 包括 “ 拟 
合 优 度 ” 测 试 。6.4.7 节 有 出 版 物 的 具体 信息 。 


6.4.5 生效 原理 


尽管 对 本 福特 定律 的 证 明 是 相当 具有 技术 性 的 , 但 也 有 一 些 针对 此 数学 原理 的 、 有 见地 旦 直 
观 的 解释 。 马 克 … 内 格 罗 尼 ( 1999 ) 就 提供 了 一 个 这 样 的 解释 ， 我 觉得 特别 有 吸引 力 。 

他 的 解释 是 这 样 的 。 想 象 一 下 ， 将 初始 金 100 美 元 用 于 某 种 投资 ,预计 金额 以 10% 的 年 增长 
率 增长 ， 总 金额 的 第 一 位 有 效 数字 变 为 2 将 大 约 需 要 7.3 年 的 时 间 。 这 是 因为 总 量 需 要 增加 100%， 
才能 达到 200 美 元 的 价值 。 相 比 之 下 , 考虑 500 美 元 增加 到 600 美 元 的 时 间 。 如 果 我 们 继续 假设 10% 
的 年 增长 速度 ， 它 将 需要 大 约 1.9 年 才能 达到 600 美 元 。 所 以 ， 投 资金 额 的 首位 数 是 5 时 ， 所 需 时 
间 比 投资 金额 首位 数 是 1 时 要 少 很 多 ,一旦 总 金额 达到 1000 美 元 , 在 其 第 一 位 数 变 成 2 之 前 ( 男 一 
个 100% 增 长 )， 将 再 次 需要 约 7.3 年 的 时 间 。 

现实 世界 确实 比较 复杂 一 点 ， 但 是 这 确实 有 助 于 解释 为 什么 1 作为 首位 数 比 其 他 数字 作为 首 
位 数 要 更 常见 。 另 一 种 直观 的 解释 是 ,如果 有 上 比 大 城市 数量 更 多 的 小 城镇 , 那么 就 有 比 长 河流 数 
量 更 多 的 短 河流 。 












































6.4.6 ”无 效 领域 
本 福特 定律 不 太 可 能 运用 在 无 足够 变异 的 数据 集 , 或 非 随 机 选择 的 数据 集 上 。 例如 , 计算 机 
上 的 文件 大 小 大 致 遵循 本 福特 定律 ， 但 只 有 当 所 选 文件 的 类 型 没有 限制 时 ， 才 可 以 采用 本 福特 
为 了 说 明 这 一 点 ， 我 在 一 台 蔷 果 PowerBook G4 笔 记 本 电脑 中 找 出 了 文件 大 小 的 第 一 个 数字 
的 频率 。 图 6-3 和 表 6-11 中 展 出 的 结果 显示 出 了 本 福特 定律 。 
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660 172 个 电脑 文件 大 小 首 个 数字 的 
5 相对 频率 与 本 福特 定律 的 比较 
[文件 大 小 
0.3 园 本 福特 
0.25 
必 0.2 
Ea 
后 015 
友 
到 
0. 人 5 
0.05] | ] 
0 二 | 
0 1 3 4 5 6 x 8 9 
首 个 非 零 数字 
图 6-3: 遵循 本 福特 定律 的 电脑 文件 
表 6-11: 大 致 遵循 本 福特 定律 的 电脑 文件 
首位 非 零 数字 660 172 个 电脑 文件 首位 数字 的 相对 频率 根据 本 福特 定律 的 概率 
1 0.277 0.301 
好 0.181 0.176 
3 0.144 0.125 
4 0.107 0.097 
5 0.076 0.079 
6 0.067 0.067 
7 0.054 0.058 
8 0.054 0.051 
9 0.041 0.046 








尽管 图 6-3 和 表 6-11 所 示 的 结果 是 基于 660 172 个 文件 的 ， 表 6-12 显 示 ，600 个 样本 就 足以 表现 
出 本 福特 定律 模式 (虽然 不 如 更 大 样本 的 表现 效果 )， 只 要 文件 样本 是 随机 的 。 


























表 6-12: 600 个 计算 机 文件 大 小 的 随机 选择 





首 个 非 零 数字 600 个 电脑 文件 首位 数字 的 相对 频率 根据 本 福特 定律 的 概率 
1 0.262 0.301 
2 0.187 0.176 
3 0.147 0.125 
4 0.107 0.097 
5 0.069 0.079 
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( 续 ) 
首 个 非 零 数字 600 个 电脑 文件 首位 数字 的 相对 频率 根据 本 福特 定律 的 概率 
6 0.070 0.067 
7 0.052 0.058 
8 0.057 0.051 
9 0.052 0.046 


为 了 便于 比较 ， 我 计算 了 同一 台 计 算 机 上 iTunes 音 乐 库 中 的 MP3 文 件 的 相对 频率 。 表 6-13 和 





图 6-4 表 明 ， 该 组 文件 不 遵循 本 福特 定律 。 








表 6-13: 不 遵守 本 福特 定律 的 MP3 音 乐 文件 
字 

















































































































首位 非 零 数 601 首 MP3 文 件 首位 数字 的 相对 频率 根据 本 福特 定律 的 概率 
1 0.080 0.301 
8 0.097 0.176 
3 0.276 0.125 
4 0.270 0.097 
5 0.161 0.079 
6 0.070 0.067 
3 0.023 0.058 
8 0.013 0.051 
9 0.001 0.046 
iTunes 上 601 个 MP3 文 件 其 大 小 的 首 个 数字 
0 相对 频率 与 本 福特 定律 的 比较 
MP3 文 件 大 小 
0.3 园 本 福特 
0.25] 
尾 0.2 
EE 
内 
芋 0.15] 
pa 
里 
0. 霖 
国 有 有 
0 
0 2 3 水 5 6 7 8 9 
首 个 非 零 数 字 








图 6-4: 不 遵守 本 福特 定律 的 MP3 音 乐 文件 
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600 首 MP3 格 式 的 音乐 文件 的 大 小 不 近似 本 福特 定律 ， 这 并 不 奇怪 ， 因 为 MP3 音 乐 文件 的 大 
小 表现 出 的 变异 比 更 随机 任 取 的 600 个 计算 机 文件 的 变异 要 少 得 多 。 
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口 你 可 以 在 http://homepage.mac.com/samchops/benford/ 获 得 生成 本 部 分 图 表 的 Matlab 代 码 ; 

在 http:/www.mathworks.com 下 载运 行 代 码 的 Matlab 安 装 包 。 








J 6.5 物 归 其 
l 1】 文体 测算 (Stylometrics ) 作为 一 种 统计 方法 ， 可 标识 出 定义 作者 风格 的 相关 维度 。 
它 采 用 因素 分 析 的 方法 来 判断 谁 是 作品 的 作者 。 
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豪 - 马 奇 教授 面临 着 一 个 问题 。 他 最 好 的 两 名 学 生 现在 都 坐 在 他 的 办 公 室 里 ， 和 希望 能 解决 一 
个 争议 。 豪 - 马 奇 博士 将 保罗 的 期 末 论 文 评 为 A+ (这 是 一 篇 探讨 巧克力 牛奶 重要 性 的 历史 论文 )， 
但 问题 是 ， 丽 莎 声称 那 篇 论文 是 她 写 的 。 这 构成 了 抄袭 指控 ! 两 人 都 是 好 学 生 ,， 在 过 去 都 为 教授 
写 了 许多 高 质量 的 论文 。 所 以 ,判断 谁 是 真正 的 作者 并 不 容易 ,意识 到 最 喜欢 的 学 生 之 一 是 个 骗 
子 也 不 容易 。 


溺 好 , 相 比 他 担任 的 州立 社区 学 院 和 货运 学 校 兼职 教授 一 职 , 作为 优秀 哲学 博士 的 多 年 经 验 
使 他 能 够 想 出 更 有 效 的 方法 。 除 了 一 些 不 明显 的 统计 爱好 ， 豪 - 马 奇 博士 还 涉足 文体 测算 领域 ， 
这 是 一 种 对 文字 作品 风格 分 类 的 统计 方法 。 该 方法 也 可 用 于 识别 匿名 作者 。 当 有 好 几 种 可 能 性 或 
者 知 干 嫌疑 人 以 供 选择 时 ， 当 嫌疑 人 的 典型 写作 风格 已 知 并 已 量化 时 ， 该 方法 的 效果 最 好 。 让 我 
们 看 着 心 碎 的 教授 如 何 应 用 这 些 技术 找到 真正 的 作者 。 































































































6.5.1 建立 模型 


首先 ， 豪 - 马 奇 博士 让 保罗 和 丽 莎 带 来 所 有 他 们 在 过 去 写 的、 没有 争议 的 其 他 论文 。 仅 用 短 
短 几 分 钟 ， 这 些 论文 就 被 扫描 到 计算 机 中 ， 并 形成 两 位 作者 使 用 的 不 同 单词 的 数据 库 。 








或 者 ， 可 以 将 论文 以 电子 版 的 形式 发 送 给 教授 ,这 样 就 无 需 打 描 了 ; 这 和 故事 没有 
一 点 关系 ， 那 你 为 什么 要 问 我 呢 ? 


第 一 步 分 析 ， 将 两 位 作者 写 的 所 有 单词 放 在 一 起 。 豪 - 马 奇 博士 数 出 每 个 单词 的 使 用 频率 ， 
在 单词 结合 数据 库 中 确定 最 常 使 用 的 530~100 个 单词 。 这 些 单词 作为 项 目 或 关键 变量 构成 因素 分 析 
(factor analysis ) 所 用 的 数据 。 因 素 分 析 是 这 样 一 个 统计 方法 : 它 着 眼 于 组 间 变 量 的 相关 性 [Hack 
#11]， 并 识别 出 一 组 群 变量 ,， 这 组 群 变量 的 彼此 相关 性 比 它 们 和 其 他 变量 的 相关 性 更 强 。 不 管 这 
些 变量 的 共同 之 处 是 什么 ， 它 们 都 被 假定 共享 一 个 因素 、 部 分 或 维度 。 

便于 我 们 故事 的 开展 ， 我 只 列 出 10 个 豪 - 马 奇 博 十 认定 的 两 位 作者 最 常用 的 词 。 表 6-14 显 示 
了 这 些 词 和 它们 的 使 用 频率 。 当 查看 保罗 和 丽 莎 写 的 所 有 词 时 , “the” 的 使 用 频率 为 4.2% ， 
“weasel” 的 使 用 频率 为 1%， 以 此 类 推 。 















































表 6-14: 保罗 和 丽 莎 的 常用 词 及 其 频率 





词 频率 
the 4.2% 
and 2.1% 
to 1.8% 
a 或 an 1.2% 
weasel 1.0% 


of 0.8% 
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( 续 ) 
词 频率 
in 0.8% 
that 0.5% 
it 0.4% 
not 0.2% 





这 些 词 作为 变量 试图 找 出 描述 一 个 或 多 个 风格 维度 的 潜在 因素 。 保 罗 和 丽 莎 的 风格 可 能 体现 
在 这 些 维度 的 不 同 地 方 。 可 能 只 有 一 个 维度 或 因素 导致 这 些 词 用 法 各 异 , 也 可 能 有 很 多 维度 或 因 
素 。 一 旦 确定 这 些 由 相关 变量 共同 定义 的 维度 或 维度 上 的 载荷 , 任何 写作 样本 都 可 以 被 放置 在 由 








因素 搭建 出 框架 的 理论 空间 里 。 








之 - 马 奇 博士 进行 因素 分 析 的 数据 来 自作 品 样 本 的 各 部 分 , 每 部 分 包含 500 个 单词 。 每 部 分 在 
每 个 单词 变量 上 都 有 一 个 得 分 。 得 分 是 这 个 单词 在 该 段落 使 用 的 次 数 。 表 6-15 展 示 了 豪 - 马 奇 博 








士 收集 的 数据 例子 。 
表 6-15: 研究 数据 的 样本 
the and to al/an weasel of in that it not 

第 1 部 分 ”21 8 11 5 4 0 0 1 0 2 
第 2 部 分 ”10 了 15 5 2 10 1 0 0 0 
第 3 部 分 5 5 5 2 6 12 2 4 1 0 
第 4 部 分 0 2 4 3 1 4 6 8 1 0 
第 5 部 分 “4 11 16 2 0 3 5 0 3 1 


四 。 表 6-15 中 ， 分 数 表示 每 个 单 


6.5.2 ”因素 分 析 
接着 , 豪 - 马 奇 博士 进行 因素 分 析 ， 


词 出 现在 文本 部 分 的 次 数 。 














因素 分 析 是 一 个 相当 复杂 的 数学 过 程 ， 所 以 现在 基本 使 











用 计算 机 来 完成 ， 与 此 同时 ,研究 人 员 根 据 相 关 理 论 在 分 析 过 程 中 的 不 同时 刻 作 出 决策 。 基 本 
上 ， 要 不 断 分 析 变 量 之 间 的 关系 ， 直 到 发 现 少 数 变 量 组 似乎 可 以 尽 可 能 多 地 解释 数据 的 变异 1 

时 ， 因 素 才 被 确定 下 来 。 每 个 分 组 变量 共享 的 共性 提供 了 定义 该 因素 的 数学 素材 。 一 旦 因素 被 
选择 ， 任 何 观 测 ( 在 本 例 中 是 文本 样本 ) 都 能 得 到 因素 得 分 ， 然 后 以 因素 分 数 为 坐标 ， 将 其 置 








于 那个 理论 空间 里 。 














在 本 例 中 ,分 析 表 明 ， 有 两 个 因素 很 好 地 描述 了 样本 文本 。 因 素 1 通过 使 用 的 单词 来 定义 ， 





比如 一 端 使 用 “a/an” 而 男 一 端 使 用 “of” 





和 “in”。 换 名 话说 ,文本 部 分 基于 他 们 使 用 冠 词 的 频 




















次 而 不 同 ， 有 和 较 高 冠 词 使 用 频率 的 部 分 往往 使 用 较 少 的 介词 。 因 素 2? 通 过 “weasel” 一 词 的 使 用 
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在 探索 性 因素 分 析 中 , 通常 研究 者 对 发 现 和 命名 能 解释 人 类 行为 和 特征 的 基本 结构 ( 即 无 形 
的 特征 ) 感 兴趣 。 不 过 ， 在 本 例 中 ， 察 - 马 奇 教 授 只 对 定义 维度 〈 例如， 单词 使 用 ) 感 兴趣 ， 这 
些 维度 是 基于 变量 的 ， 且 能 在 两 端 对 变量 进行 锚 定 。 他 没 兴趣 搞 清楚 为 什么 那些 经 常 出 现 单词 
“the” 的 文本 也 也 往 包 含 高 频率 的 “a” 或 “an”。 他 同样 对 “weasel” 一 词 的 使 用 为 什么 能 够 区 
分 不 同 的 写作 样本 不 感 兴趣 。 对 他 而 言 , 他 只 需要 知道 这 两 个 因素 提供 了 一 对 良好 的 坐标 轴 ， 定 
位 出 两 位 作者 在 他 们 样本 中 使 用 的 所 有 单词 的 位 置 。 


计算 保罗 和 丽 莎 样本 论文 的 因素 得 分 , 很 明显 ,结果 表明 两 位 作家 有 不 同 的 风格 。 丽 莎 比 保 
罗 更 频繁 地 使 用 “weasel” 这 个 词 ， 她 的 论文 在 因素 2 上 得 分 高 。 丽 莎 的 论文 也 倾向 于 高 频 使 用 
冠 词 ， 在 因素 1 上 的 分 数 也 非常 高 。 另 一 方面 ， 保 罗 的 论文 往往 避免 使 用 “weasel” 这 个 词 ， 而 
且 倾 向 使 用 因素 1 末端 的 介词 。 


仅 使 用 单词 来 描述 或 许 很 难 把 握 ， 所 以 我 们 借助 一 个 图 例 画 一 幅 图 来 演示 样品 文本 的 位 置 。 
图 6-5 显 示 了 这 两 个 因素 : 定义 它们 的 单词 使 用 ， 还 有 不 同 写 作 样 本 载荷 在 两 个 因素 的 位 置 。 为 
便于 讨论 , 图 6-5 只 显示 了 少数 的 写作 样本 ,只 标 出 了 表 6-14 和 表 6-15 中 的 10 个 词 。 图 中 同样 标 出 
了 那 篇 有 争议 的 论文 在 理论 空间 的 维度 位 置 。 
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丽 莎 样本 1 







































































保罗 样本 2 








保罗 样本 3 





























图 6-5: 文本 样本 的 因素 分 析 

谜 题 的 答案 现在 已 经 很 清楚 了 。 有 争议 的 文章 与 丽 莎 的 论文 特点 一 致 ， 而 与 保罗 的 不 一 致 。 
保罗 和 丽 莎 的 早期 论文 表现 出 一 致 性 但 却 有 不 同 的 风格 , 至 少 在 由 单词 计数 所 定义 的 风格 上 是 不 
同 的 ， 因 素 图 是 识别 论文 所 属 作者 的 一 个 有 用 工具 。 
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豪 - 马 奇 博士 给 丽 莎 A+ 的 成 绩 并 指责 保罗 抄袭 ， 他 现在 正人 忙于 和 保罗 的 律师 展开 漫长 的 官 
司 ， 这 无 疑 会 使 得 我 们 优秀 的 统计 学 家 朋友 身 无 分 文 。 不 过 , 重要 的 事情 是 ， 有 一 个 统计 方法 得 
以 展现 。 科 学 再 一 次 获胜 。 





6.5.3 ”参阅 


“Who wrote the 15th book of Oz?,”by J.N.G. Binongo in Chance, 16, 2, 9-17. 


1 WW 6:6 在 帕斯卡 三 角 上 播放 音乐 
并 订 向 想 很 决 知道 几率 是 多 少 ? 帕斯卡 三 角 是 一 个 简单 的 数字 布局 ,能 够 决 如 且 容易 地 计算 
概 闸 。 这 300 年 来 它 一 直 有 效 ， 所 以 我 地 打 财 ， 它 对 你 也 有 效 。 


统计 人 员 最 常 做 的 事 就 是 计算 概率 , 概率 可 以 对 于 各 种 情况 描述 预期 的 结果 。 一 个 简单 的 例 
子 是 抛 硬币 。 试 想 一 下 ,你 曾 被 要 求 对 抛 硬币 的 结果 下 注 。 有 两 个 可 能 的 结果 ， 正 面 或 反面 , 一 
次 抛 硬 币 ， 结 果 无 论 是 正面 还 是 反面 ， 几 率 都 是 1/2。 


如 果 你 知道 得 到 获胜 结果 的 不 同方 法 数 以 及 可 能 的 结果 数 , 那么 数学 上 计算 就 很 容易 。 在 抛 
硬币 的 例子 中 ， 只 有 一 种 方式 能 获得 一 个 获胜 的 结果 , 并 且 只 有 两 种 可 能 的 结果 。 我 们 进行 多 次 
硬币 翻转 ， 如 果 想 要 知道 所 有 可 能 的 结果 数 ， 以 及 这 些 组 合 有 多 少 符合 我 们 的 获胜 标准 , 那么 这 
样 的 数学 计算 就 稍微 难 了 一 点 。 例如， 如 果 我 想 要 在 两 次 硬币 翻转 中 连续 出 现 两 次 正面 , 我 可 以 
列 出 所 有 可 能 的 结果 ,确定 使 我 获胜 的 结果 数量 , 然后 看 我 获胜 的 所 有 结果 占据 多 大 比例 。 这 一 
比例 就 是 获胜 的 几率 。 

但 是 ,获胜 的 可 能 结果 数 往往 比 我 们 简单 的 掷 硬币 例子 更 复杂 ， 因 为 可 能 有 许多 试验 ( 掷 侦 
子 、 购 买 彩票 ,或 诸如 此 类 ) 和 许多 不 同 的 组 合 。 例 如 ， 你 可 能 想 要 弄 清 楚 从 一 项 帽子 中 抽出 或 
通过 其 他 随机 方法 选择 的 物体 中 ， 不 同 元 素 的 可 能 组 合 数量 。 

想象 一 下 ， 你 和 亲 威 共 6 人 准备 开车 去 机 场 ， 你 们 必须 都 坐 一 辆 有 厢 式 货车 过 去 。 你 并 不 偏好 
谁 更 多 ,所 以 你 需要 某 个 公平 的 方式 来 决定 大 家 的 位 置 。 一 同 前 往 时 ， 你 会 随机 挑选 两 个 名 字 坐 
在 前 排 座位 。 



























































所 给 我 叔 相 弗兰克 的 私人 字条 : 是 的 ， 这 个 例子 基于 去 年 “不 愉快 的 ”感恩 节 。 我 们 
彼此 谅解 吧 ， 至少 我 家 这 边 如 此 ， 但 我 们 认为 如 果 你 明年 能 把 自己 的 车 开 过 来 就 最 
好 了 。 


现在 , 你 需要 知道 你 坐 前 排 座位 的 几率 ,以 及 你 可 能 与 谁 坐 一 起 的 几率 。 问 题 是 计算 坐 前 排 
座 的 亲 威 有 多 少 种 不 同 的 组 合 。 对 于 这 两 种 简单 的 赌注 ， 如 硬币 翻转 和 生死 侯 关 情况 下 的 长 途 车 
旅行 ， 你 可 以 使 用 被 称 为 帕斯卡 三 角 的 数字 布局 进行 计算 。 
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6.6.1 帕斯卡 三 角 介 绍 

帕斯卡 三 角 如 图 6-6 所 示 。 这 种 数字 的 布局 有 一 些 有 趣 的 属性 。 下 图 显示 它 由 10 行 组 成 ， 最 
底 行 有 10 个 数字 ， 但 它 可 以 扩展 成 无 限 多 行 变 得 无 限 大 。 往 下 走向 的 外 边缘 数 都 是 1。 临 近 的 对 
角 线 从 1 开始 ， 但 是 它们 每 往 下 一行， 数字 就 增加 1。 






































图 6-6: 帕斯卡 三 角 

类 似 有 趣 的 级 数 在 整个 三 角 中 都 能 发 现 。 注 意 , 每 个 数字 都 是 这 个 数字 上 面 两 个 数字 的 总 和 : 
84=56+28，7=6+1， 以 此 类 推 。 但 是 ， 这 些 很 酷 的 模式 不 是 我 们 对 三 角 感 兴趣 的 原因 。 相 反 ,， 我 
们 要 用 它 来 计算 各 种 结果 的 概率 。 














6.6.2 ”使 用 帕斯卡 三 角 计 算 概率 


因 布 莱 效 ' 帕斯卡 (Blaise Pascal， 一 个 生活 在 17 志 纪 ， 很 聪明 的 早期 概率 理论 贡献 者 ) 而 
命名 的 帕斯卡 三 角 ， 已 经 利用 了 我 们 回答 各 种 各 样 的 问题 所 需要 的 计算 。 














虽然 这 种 数字 模式 被 称 为 帕斯卡 三 角 ， 但 发 明 者 却 不 是 帕斯卡 ， 他 本 人 也 从 未 声称 
发 明了 它 。 帕 斯 卡 的 老师 提出 过 类 似 的 数字 模式 , 同时 期 也 有 其 他 人 在 论著 里 提 及 。 


存在 一 个 通用 公式 可 以 确定 特定 类 型 的 可 能 结果 数 。 这 个 公式 适用 于 恰好 有 两 种 可 能 结果 
时 ， 因 此 , 术语 三 项 式 系数 就 用 来 描述 该 公式 的 结果 (二 项 式 是 指 具 有 两 个 名 字 , 或 在 统计 意义 
上 ， 具 有 两 个 结果 )。 为 了 确定 给 定数 量 的 试验 中 可 能 结果 的 二 项 组 合 ， 可 用 这 个 计算 公式 : 














k! 


人 摧 鞭 胜 组 公 妆 y 二 
可 能 的 获胜 组 合 Pr -| 
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能 带 入 这 个 公式 的 可 能 范围 值 是 帕斯卡 图 形 上 的 坐标 。 方 程 中 的 zx 表示 试验 或 事件 的 次 数 ， 
表示 在 图 中 找 哪 一 行 。 公式 中 的 告诉 我 们 这 一 行 的 具体 条 目 。 沿 着 图 形 左边 的 那些 数字 1 像 是 一 
个 边界 : 它们 算 作 0。 因 此 ， 要 使 用 三 角 ， 我 们 以 0 开始 计数 。 











在 这 个 公式 中 ， 一 些 数 字 后 的 感叹 号 表示 阶乘 ， 这 反 过 来 又 意味 着 ， 你 应 该 从 这 个 
数字 倒 计 到 1， 并 乘 以 所 有 倒 计 的 这 些 数 。 例 如 ，5 的 阶乘 是 Sx4x3x2x1， 即 120。 顺 
便 说 一 下 ， 根 据 规则 ，0! 为 1。 


1. 评估 翻转 硬币 结果 的 概率 
下 一 步 , 我 们 解决 稍微 复杂 一 点 的 抛 硬 币 问题 , 抛 一 枚 硬币 两 次 正好 出 现 两 次 正面 的 几率 可 
以 使 用 三 角 来 计算 。 
(1) 要 找 的 那 行 由 我 们 翻转 硬币 的 数量 决定 : 2。 我 们 要 数 的 那 行 的 条 目 由 我 们 想 看 到 的 正面 
的 结果 决定 : 2。 对 于 我 们 掷 硬币 的 例子 ，2 次 试验 中 出 现 2 次 正面 ， 往 下 数 两 行 至 如 下 行 。 
121 
(2) 然后 ， 数 两 个 条 目 到 1。 我 们 的 答案 是 1， 所 以 我 们 得 到 两 个 正面 的 机 会 有 1 次 。 


(3) 但 是 多 少 次 机 会 里 有 1 次 呢 ? 把 你 那 行 的 数字 相 加 ， 就 得 到 了 那个 答案 。1+2+1=4， 所 以 
我 们 的 几率 是 1/4 或 25%。 


三 角 也 可 以 回答 更 复杂 的 问题 。 假 设 你 想 在 6 次 硬币 翻转 中 正好 得 到 3 个 正面 。 
(1) 往 下 数 6 行 ( 记得 把 三 角 顶 部 记 为 0 )。 你 到 了 如 下 这 行 。 
1615201S61 

(2) 数 3 个 数字 你 得 到 了 20。6 次 硬币 翻转 ， 正 好 得 到 3 个 正面 的 不 同方 式 有 20 种 。 

(3) 你 会 问 ， 是 多 少 可 能 性 中 的 20 种 ? 对 该 行 所 有 的 值 加 和 我 们 得 到 了 64。64 次 中 有 20 次 ， 
你 会 恰好 得 到 3 个 正面 (或 3 个 反面 )。 概 率 大 约 是 31%。 

2. 评估 一 趟 糟糕 的 自驾 之 旅 的 概率 

男 一 种 使 用 三 角 的 方法 是 , 看 看 以 一 定 方式 抽取 的 某 种 数量 的 元 素 有 多 少 种 可 能 组 合 。 我 们 
自驾 之 旅 的 例子 关注 从 6 人 中 抽取 2 人 有 多 少 可 能 组 合 。 


一 组 中 有 6 个 要 素 , 你 将 抽出 其 中 2 个 并 将 其 匹配 起 来 。 对 于 这 个 的 问题 ,以 及 定义 三 角 的 二 
项 式 公 式 ， 把 6 个 亲戚 想象 成 4+， 要 抽取 的 2 个 名 字 为 k。 


(1) 往 下 数 6 行 然后 跨 过 2 个 条 目 ， 你 得 到 数字 15。 从 6 个 人 中 抽取 2 个 人 ,有 15 种 可 能 的 组 合 。 
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(2) 在 这 种 情况 下 ， 你 只 对 和 某 个 特定 的 人 坐 在 车 前 排 的 几率 感 兴趣 。 这 是 15 种 可 能 的 组 合 
中 前 排 乘客 的 1 种 组 合 。 因 此 ， 你 和 你 讨厌 的 弗兰克 叔叔 或 东 莉 妨 群 ， 或 任何 人 ， 坐 在 前 排 座 椅 
上 的 概率 仅 有 1/15。 





6.6.3 ”生效 原理 


如 果 你 真 的 利用 二 项 式 公 式 进行 数学 计算 ,那么 三 角 中 的 数字 会 匹配 你 数学 计算 得 到 的 值 ， 
但 你 会 发 现 , 三 角 还 能 回答 其 他 问题 。 数 字 的 模式 、 它 们 的 级 数 , 与 其 他 确定 概率 时 使 用 的 公式 
都 是 一 致 的 。 
举例 来 说 ，6 次 硬币 翻转 总 的 可 能 翻转 组 合 数 ， 由 累加 三 角 中 第 六 行 的 值 来 回答 : 64。 你 可 
以 通过 应 用 反 转 硬币 后 可 能 结果 的 通用 公式 来 对 其 进行 数学 推导 ， 求 出 这 个 值 ，2™=2%=64。 

至 于 你 既 会 被 选中 为 6 人 中 的 2 人 , 同时 和 你 一 起 坐 前 排 的 人 又 是 其 他 特定 人 的 其 中 一 个 (我 
们 去 机 场 的 例子 ) 的 几率 ， 三 角 表示 是 1/15。 但 你 也 可 以 通过 下 面 的 方式 计算 : 

(GD 成 为 6 人 中 选 出 的 两 人 之 一 的 几率 =2/6-0.33; 

(2) 从 5 个 “其 他 ”人 中 选 出 1 个 特定 的 人 的 几率 =1/5=0.20; 

(3) 两 者 同时 发 生 的 几率 =0.33 x 0.20=0.066， 或 1/15。 

所 以 ， 当 你 涉及 的 组 合 和 排序 看 起 来 很 复杂 ,有 如 此 多 的 可 能 性 使 你 头 举 时 ,让 帕斯卡 三 角 
舒缓 的 音乐 给 你 混乱 的 大 脑 带 来 安宁 。 















































i I 6.7 控制 随想 
我 们 的 内 局 思想 本 就 漫 无 边际 ， 人 们 认为 这 能 创造 不 可 预测 的 获 机 路 径 。 你 可 以 提高 
周 图 人 聚焦 在 你 希望 的 事物 上 的 概 村， 利用 这 个 误解 来 猜测 周 图 人 的 想法 。 

我 们 对 邻 人 毛骨悚然 的 场面 并 不 陌生 ， 埃 德 加 ' 爱 伦 . 坡 (Edgar Allen Poe ) 在 《 莫 格 街 谋 
杀 案 》( Murders in the Rue Moregue ) 中 提 到 了 这 点 : 

我 们 两 人 陷入 沉思 ， 至 少 1 分 钟 内 谁 都 没 说 一 个 字 。 突 然 ， 杜 宾 蹦 出 一 句 话 : “他 是 一 个 非 
常 小 的 家 伙 , 这 是 真 的 ， 能 为 杂技 团 做 得 更 好 。”“ 那 是 毫 无 疑问 的 ， ”我 不知 不 觉 地 回答 说 …… 
“ 杜 宾 ，” 我 严肃 地 说 ，“ 这 我 无 法 理解 。 我 毫 不 犹 移 地 说 我 很 惊讶 ， 而 且 几 乎 无 法 相信 我 的 感 
觉 。 你 怎么 可 能 知道 我 在 想 (什么 ) ? ” 

你 是 否 曾经 一 直 和 某 人 交谈 ， 中 间 你 的 思想 开 了 一 小 会 儿 差 ?然后 ， 你 提出 了 你 想 的 东西 ， 
你 惊奇 地 发 现 ， 男 一 个 人 也 在 想 同样 的 事情 ! 

为 什么 会 这 样 呢 ? 你 能 做 到 这 一 点 吗 ? 你 能 预测 另外 一 个 人 要 说 什么 吗 ? 是 的 ， 很 有 可 能 ， 
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你 有 时 可 以 做 到 这 一 点 , 有 时 你 可 以 预测 另外 一 个 人 要 说 的 话 。 如 果 你 们 两 个 人 都 有 共同 的 背景 
经 历 ， 尤 是 如 此 。 


6.7.1 思想 控制 


我 们 的 记忆 中 充满 了 单词 、 想 法 、 故 事 等 ， 它 们 和 其 他 的 单词 、 想 法 和 故事 相关 联 。 如 果 你 
希望 蘑 人 思考 某 一 话题 , 这 样 你 就 可 以 读 懂 他 的 心思 , 那么 , 让 他 思考 到 你 希望 让 他 思考 的 东西 ， 
最 容易 的 方式 是 提出 一 个 与 所 需 话题 密切 相关 的 话题 。 

例如 ， 如果 你 希望 你 的 朋友 开始 思考 狮子 、 老 虎 和 人 能, 你 可 以 让 与 这 一 主题 相关 的 单词 进入 
他 的 思维 过 程 ， 如 绿野仙踪 、 桃 乐 苗 、 托 托 ， 其 至 条 纹 ， 因 为 条 纹 和 老虎 是 高 度 关联 的 。 

所 有 的 词 在 书面 语 和 口头 语 中 都 有 一 定 的 出 现 频率 。 有 些 单词 有 非常 高 的 出 现 频率 ( 比如 : 
这 个 、 它 ， 等 等 )， 而 有 些 单词 具有 非常 低 的 出 现 频率 ( 比如 : 土 豚 )。 此 外 ， 有 些 单词 和 其 他 单 
词组 合 出 现 的 频繁 相当 高 ( 比如 : 盐 和 胡椒 ， 韵 律 和 蓝调 )。 事实 上 ， 有 些 词 经 常 一 同 出 现 ， 以 
至 于 研究 发 现 : 即使 只 说 出 一 个 单词 ， 人 们 也 会 立刻 想到 其 他 的 词 。 

通过 学 习 这 些 关联 , 我 们 可 以 更 快速 地 处 理 传人 的 信息 。 如 果 我 们 听 到 盐 ， 就 能 想到 盐 和 胡 
椒 ， 那 我 们 就 领先 一 步 了 ， 并 可 以 在 晚餐 同伴 要 求 我 们 递 给 他 之 前 就 开始 伸手 去 拿 盐 和 胡椒 。 

所 以 ， 如 果 你 想 “ 控 制 ” 人 的 思想 ， 关 键 是 简单 地 知道 哪些 事情 最 经 常 一 起 发 生 。 一 个 单词 
出 现 的 越 频 繁 , 某 人 想到 它 的 可 能 性 越 大 。 同 样 ， 两 个 词 一 起 出 现 的 越 频繁 ， 当 只 说 出 一 个 词 时 
就 想到 两 个 词 的 可 能 性 越 大 。 





































































































6.7.2 ”概率 与 单词 联想 


多 年 来 , 感 兴趣 的 研究 者 已 经 收集 了 很 多 关于 关联 单词 的 数据 ,以 分 析 对 我 们 人 类 来 说 什么 
是 常见 的 。 精神 科 医 生 使 用 单词 之 间 自 由 联想 的 典型 知识 作为 读 取 潜意识 的 工具 。 认 知 心理 学 家 
使 用 相同 的 信息 来 映射 大 脑 处 理 信 息 的 方式 。 

现在 已 有 大 量 的 、 关 于 线索 ( 提出 的 这 个 词 可 能 会 导致 联想 ) 和 靶子 〈 在 线索 提出 后 想到 的 
单词 ) 的 已 知 信息 。 表 6-16 展 示 了 单词 线索 的 样本 ,以 及 正常 人 会 想到 特别 靶子 的 概率 ， 比 如 你 
的 朋友 。 该 表 提 供 了 一 系列 的 好 线索 和 坏 线索 ， 以 供 你 理解 大 部 分 思维 是 如 何 工作 的 。 
































表 6-16: 单词 联想 几率 





线索 靶子 概率 
安全 套 性 0.53 
颠 敏 的 性 0.01 





西 兰花 绿色 0.25 
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( 续 ) 
线索 靶子 概率 
西 兰花 毛 0.01 
睡衣 裤 睡觉 0.36 
事故 车 辆 0.36 
事故 哎呀 0.01 
妈妈 爸爸 0.60 
妈妈 向 0.02 
牙医 牙齿 0.42 
英雄 超人 0.17 
英雄 蝙蝠 侠 0.02 
统计 数字 0.26 
统计 无 聊 0.03 
凉拌 卷心菜 鱼 0.01 


























当 你 想 让 你 的 被 试 去 思考 某 些 词 或 想法 时 , 像 上 面 这 样 的 信息 就 是 有 用 的 。 例 如 , 对 于 “性 ” 
这 个 词 来 说 ,“ 安 全 套 ” 这 个 线索 比 “ 颠 艇 的 ”会 让 你 有 更 多 的 幸运 。 


_ ” 表 6-16 抽 取 自 http://w3.usf.edu/FreeAssociation/ 网 站 ， 上 面 有 详尽 的 数 千 单 词 的 联想 
清单 ， 由 南 佛罗里达 大 学 和 堪萨斯 州 的 研究 人 员 尼 尔 森 、 麦 克 沃 伊 和 施 雷 伯 提 供 。 


6.7.3 ”建立 单词 联想 列表 

联想 的 观念 和 单词 形成 了 人 与 人 之 间 稍 有 差异 的 连接 网 络 , 但 有 共同 文化 ( 流行 音乐 或 其 他 ) 
或 有 共同 经 验 的 人 ， 他 们 的 连接 网 络 是 相似 的 。 想 要 大 声 说 出 朋友 的 想法 〈 吓 死 他 们 )， 你 需要 
知道 你 的 隐喻 世界 里 各 个 角落 的 可 能 联想 。 

你 可 以 进行 一 个 小 的 研究 ,以 确定 对 你 朋友 而 言 哪些 单词 彼此 间 有 最 强 的 关联 性 。 创建 几 个 
有 代表 性 的 朋友 或 家 人 的 样本 。 制 造 一 张 测试 单词 列表 询问 你 的 被 试 者 ， 当 你 说 出 每 个 单词 时 ， 
他 们 最 先 想到 的 第 一 件 事 是 什么 。 常 用 短语 或 标题 中 的 单词 效果 最 好 。 但 在 随后 的 实际 对 话 中 ， 
笑话 、 电 影 或 歌曲 里 能 引发 兴趣 的 单词 是 最 适合 使 用 的 单词 类 型 。 



































所 现实 世界 里 ， 认 知心 理学 家 在 他 们 的 研究 中 用 数据 来 更 多 地 了 解 思维 过 程 ， 你 的 小 
型 研究 是 一 种 快速 方法 ， 能 够 获得 具有 相同 类 型 数据 的 小 样本 。 


对 于 某 一 单词 , 如 果 你 的 很 多 朋友 都 给 予 同一 单词 响应 的 话 , 你 可 以 假设 这 个 啊 应 单词 与 测 
试 单词 的 关联 性 非常 强 。 你 希望 将 最 高 概率 的 单词 组 成 心理 泵 吸 向 预测 结果 。 
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6.7.4 生效 原理 


人 类 的 大 脑 是 如 此 高 效 ， 以 至 于 只 要 单词 或 概念 已 经 深入 学 习 过 , 它 就 能 对 其 进行 处 理 。 研 
究 发 现 , 当 人 们 被 要 求 说 出 一 连 串 的 字母 是 否 能 组 成 一 个 单词 时 , 他 们 会 对 任务 之 前 展示 给 他 们 
的 、 预 先 学 习 或 激活 的 单词 作出 更 迅速 的 回应 。 例 如 ， 如 果 展 示 了 条 纹 的 一 词 ， 然 后 展示 老虎 或 
柠檬 单词 ， 相 比 柠 榜 ， 人 们 会 更 快 地 回应 老虎 。 

谈论 与 其 他 单词 或 主题 密切 相关 的 单词 或 主题 时 , 你 的 大 脑 的 思考 过 程 和 朋友 的 一 样 , 神经 
元 的 激活 扩散 到 大 致 同一 时 间 被 唤醒 的 神经 元 。 你 的 大 脑 已 经 习 得 , 茶 些 单词 和 话题 儿 乎 总 是 同 
时 出 现 , 所 以 当 联想 单词 或 主题 之 一 被 激活 时 , 大 脑 中 与 被 激活 单词 和 主题 相关 联 的 区 域 也 应 该 
被 唤醒 。 这 样 一 来 ， 你 的 思维 过 程 得 以 顺利 进行 。 























6.7.5 ”其 他 生效 领域 


这 种 特殊 的 思维 伎俩 有 一 些 失败 的 风险 , 尤其 当 你 使 用 低 概 率 的 关联 时 。 然而 , 你 可 能 只 是 
享受 自己 偷偷 操纵 别人 的 感觉 ， 并 不 想 通 过 它 做 大 秀 。 

我 们 可 以 激发 人 们 做 很 多 看 起 来 如 同 自然 发 生 的 事情 , 因为 这 些 事 情 的 发 生 是 如 此 频繁 上 且 毫 
不 费力 。 例 如 ， 只 需 通过 自己 打 哈 从 就 可 以 让 别人 打 哈欠 ,这 很 有 可 能 。 你 甚至 可 以 通过 谈论 打 
哈欠 或 痰 论 睡眠 让 朋友 打 哈 欠 。( 事实 上 ，, 我 写 到 这 里 时 ， 就 打 了 个 哈欠 。) 同样 地 ， 如 果 有 一 些 
食物 ， 你 想 将 其 作为 正餐 ， 那 么 你 可 以 通过 提 及 这 种 食物 让 你 的 家 人 也 渴望 它 。 

你 可 能 已 经 自我 激发 很 多 次 了 。 当 你 正 听 着 喜欢 的 CD 时 ， 一 首 歌 结束 了 ， 你 是 不 是 在 下 一 
首 歌 开始 播放 前 已 经 开始 在 脑海 里 听 到 这 首 歌 了 ? 如 果 你 知道 某 人 会 把 什么 事物 关联 在 一 起 , 那 
么 在 你 激发 这 些 事物 之 后 , 预测 此 人 的 想法 会 变 得 相对 容易 。 这 是 结婚 的 人 往往 能 接续 彼此 话语 
的 一 部 分 原因 。 





















































6.7.6 无效 领 域 

如 果 某 人 和 你 的 语言 背景 不 同 , 他 们 讲 不 同 的 语言 或 讲 不 同 的 方言 , 那么 他 们 可 能 和 你 有 没 
有 相同 的 联想 词 。 

但 如 果 一 个 单词 有 若干 个 可 能 性 相同 的 联想 词 ， 这 也 无 效 。 例 如 ， 如 果 你 用 热 ( hot ) 这 个 
词 激发 别人 ,最 开始 有 些 人 可 能 会 想到 天 气 〈 热 hot， 冷 cold )。 有 些 人 可 能 会 想到 食物 ( 热狗 ， 
hot dog )， 也 有 人 可 能 会 想到 他 们 仰 共 的 人 性 感 寻 娘 ，hot babe )。 

当 你 看 到 热 这 个 词 时 ， 你 觉得 你 会 想到 哪个 词 ? 我 就 知道 你 会 这 么 说 ! 


一 士 拘 。 
豆 小 
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1 6.8 ”搜索 超 感官 知觉 “ESP) 
和 河 至 关 大 多 区 科学 家 都 认为 没有 大 多 十 据 才 明 ESP 确 实 存在 ， 但 科学 家 可 能 是 错误 的 。 
你 、 你 的 朋友 喜 你 的 区 子 可 能 就 有 ESP， 事 不 宜 记 ， 现 在 我 们 就 去 投 出 来 ! 


超 感官 知觉 (Extra-Sensory Perception，ESP ) 一 词 用 来 形容 独立 于 传统 5 种 感官 的 感知 ， 传 
统 的 5 种 感知 是 : 视觉 、 听 觉 、 触 觉 、 味 觉 和 嗅觉 。 最 先 使 用 这 个 词 的 是 20 世 纪 二 三 十 年 代 就 职 
于 杜 克 大 学 的 心理 学 家 J]. B. 莱茵 (J.B. Rhine )。 那 个 时 候 有 很 多 令 人 激动 的 事 ， 因 为 莱茵 和 他 的 
同事 们 能 够 识别 出 似乎 具有 ESP 能 力 的 个 人 。 在 那个 时 期 至 70 年 代 的 大 众 传 媒 和 一 些 科学 论文 
中 ， 有 人 甚至 理所当然 地 认为 ， 存 在 ESP 这 样 的 事 ， 我 们 都 在 一 定 程度 上 拥有 该 特质 。 

但 是 ， 时 至 今日 ， 你 真 的 没有 听 到 太 多 关于 ESP 的 消息 ， 大 多 数 科 学 家 已 经 得 出 结论 : 这 样 
的 事情 可 能 并 不 存在 。 更 具体 地 说 , 它 还 没有 达到 科学 验收 的 标准 ， 即 一 些 假设 没有 满足 期 望 的 
标准 ， 如 实验 证 明 ， 复制 研究 ， 等 等 。 但 是 ,你 可 以 添加 数据 并 开展 自己 的 研究 ,确定 你 或 你 的 
朋友 是 否 具 有 超自然 的 能 力 。 



























































6.8.1 识别 超自然 能 力 


虽然 有 各 种 所 谓 的 超自然 能 力 ， 从 读 心术 到 用 意念 移动 物体 ， 但 研究 ESP 的 传统 方式 一 直 是 
使 用 一 副 叫 齐 纳 卡 的 扑克 牌 。 齐 纳 卡 有 25 张 相同 背面 的 卡片 。 每 张 卡 面 显示 5 个 符号 中 的 1 个 : 贺 
形 、 十 字形 、 方 形 、 星 形 或 波浪 线 ， 如 图 6-7 所 示 。 


GO 十 | 口交 | 多 


















































图 6-7: 齐 纳 卡 


即使 你 手头 没有 这 些 卡 片 ， 你 也 可 以 很 容易 地 用 一 包 空白 卡片 和 一 支 黑色 马克 笔 制作 出 它 
们 。 只 要 确保 没有 人 可 以 看 穿 它 们 即 可 除非 他 们 有 超自然 能 力 , 在 这 种 情况 下 ， 他 们 也 能 看 穿 
你 )。 每 个 符号 制作 5 张 牌 ， 共 25 张 。 

使 用 洗 好 的 齐 纳 卡 进行 ES 测试 ， 有 以 下 几 种 不 同 的 方式 。 
口 在 卡 牌 被 翻转 前 ， 一 个 人 尝试 按 顺 序 报 出 牌 面 。 
口 一 个 人 看 每 张 牌 的 牌 面 ， 尝 试 将 其 以 心灵 感应 的 方式 “发 送 ”给 坐 在 旁边 的 人 。 
口 一 个 人 在 另 一 个 房间 或 在 一 个 遥远 的 位 置 ， 看 每 张 牌 的 牌 面 ， 尝 试 将 其 以 心灵 感应 方式 发 

送 给 远 距 离 的 另 一 个 人 。 有 时 候 ， 接 收 者 想象 他 们 和 发 送 者 在 同一 房间 里 ， 可 以 看 到 牌 。 
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不 管 你 选择 什么 方法 ， 流 程 是 要 遍历 25 张 牌 并 跟踪 命中 数 和 未 命中 数 。 被 试 正确 识别 了 25 
张 卡 牌 中 的 多 少 张 ? 在 一 些 研究 中 , 接收 者 有 时 在 遍历 全 部 卡 牌 的 过 程 中 就 会 被 告知 他 们 的 表现 
如 何 ， 有 时 直到 实验 结束 才 会 被 告知 表现 如 何 。 结 果 变 量 是 被 正确 识别 的 卡 牌 数量 或 百分比 。 











在 ESP 的 研究 中 ， 试 图 读 取 别 人 想法 的 人 是 接收 者 ， 想 让 自己 的 想法 被 读 取 的 人 是 
发 送 者 。 


6.8.2 ”分 析 结 果 


如 果 结 果 是 仅 由 几率 导致 的 预期 结果 ， 那 么 就 将 这 一 结果 作为 被 试 没有 超自然 能 力 的 证 据 。 
果 被 试 答对 的 数目 比 仅 靠 猜测 答对 的 数目 多 得 多 ,那么 这 一 结果 有 望 表 明 被 试 可 能 有 ESP。 
那么 ， 什 么 是 几率 导致 的 预期 ”如 果 你 猜 25 张 牌 ， 同 一 类 型 的 牌 各 有 5 张 ， 那 么 仅 靠 几 率 约 
能 猜 中 5%。 例 如 , 想象 一 下 , 25 次 中 的 每 一 次 你 都 猜 星 形 。 你 保证 会 得 到 5 次 命中 和 20 次 未 命中 ， 
因为 你 知道 总 体 来 说 星 形 出 现 的 次 数 正好 是 5 次 。 如 果 你 每 次 随机 猜 5 种 可 能 中 的 1 种 ， 那 你 的 平 
均 命 中 率 也 将 是 5/25 或 20%。 

但 是 如 果 你 有 比 20% 更 高 的 成 功率 , 说 明 什 么 ”如 果 你 25 次 中 正确 识别 了 6 次 , 成 功率 是 24% 
呢 ? 我 们 是 否 应 该 把 它 视 作 一 种 证 据 , 证 明 有 几率 之 外 的 事物 在 发 挥 作用 ? 我 们 需要 对 不 同 可 能 
结果 进行 统计 分 析 ， 以 确定 达到 多 大 比例 时 应 该 视 为 如 此 不 同 寻 常 ， 以 至 于 它 一 定 是 某 种 不 同 寻 
常 的 东西 存在 的 证 据 。 
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_ ”统计 检验 只 揭示 几率 是 否 是 对 结果 的 最 好 解释 。 对 于 我 们 的 实验 , 统计 显著 的 成 果 
并 不 能 证 明 ESP 存 在 ， 只 能 证 明 几 率 不 是 最 好 的 解释 。 毕 竟 ， 对 于 高 命中 率 的 最 好 
解释 可 能 是 接收 者 从 发 送 者 的 眼镜 里 看 到 了 被 反射 的 牌 ， 或 其 他 不 太 有 趣 的 原因 。 


我 们 知道 ， 在 短期 内 (或 用 统计 术语 表述 ， 在 一 个 小 样本 内 )， 结 果 和 总 体 不 同 是 常见 的 。 
但 是 , 我 们 也 知道 ， 和 总 体 值 之 间 大 的 差异 是 罕见 的 ， 尤其 是 从 长 远 来 看 (或 大 样本 )。 事实 上 ， 
发 现 给 定 大 小 的 样本 值 和 总 体 值 之 间 存 在 差异 的 概率 和 样本 的 大 小 有 直接 关系 。 

对 于 ESP 实 验 ， 样 本 量 是 猜测 或 试验 的 次 数 ， 总 体 是 所 有 试验 中 不 同 符 号 的 已 知 分 布 。 对 于 
总 体 值 ， 任 何 次 数 的 猜测 正确 率 都 是 20%， 这 就 是 几率 导致 的 预期 。 如 果 在 样本 值 和 总 体 值 之 间 
存在 巨大 差异 ， 那 么 可 能 就 有 几率 之 外 的 事物 在 起 作用 。 

适用 于 这 里 的 统计 分 析 称 作 Z 检 验 ，Z 检 验 用 来 比较 观测 比例 和 预期 比例 。 它 和 其 他 常见 的 
统计 检验 类 似 ， 如 t 检 验 [Hack 鸭 7],，t 检 验 计算 差 值 ,并 判断 如 果 一 个 给 定 的 样本 确实 是 从 有 某 些 
寺 征 的 总 体 中 随机 抽取 的 ， 这 样 的 差异 被 发 现 的 频率 。 
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任何 差异 的 概率 都 取决 于 样本 的 大 小 。 例 如 ， 如 果 25 次 尝试 ， 一 个 人 猜 对 了 24% ， 而 不 是 预 
期 的 20%， 那 么 对 于 这 个 分 析 ， 需 要 的 信息 是 : 

口 样本 量 25; 
口 0.24 的 观测 比例 ; 
口 0.20 的 预期 比例 。 

不 展示 这 个 特殊 分 析 的 公式 和 计算 过 程 ， 我 会 把 结果 告诉 你 。 对 于 25 次 猜测 ， 只 凭 几率 ,被 
试 有 31% 的 可 能 至 少 正确 猜 中 24% 的 牌 。 另 一 种 表述 方法 是 : 100 个 参加 研究 的 被 试 ， 其 中 有 31 
个 人 会 得 到 这 样 的 结果 或 比 这 更 好 的 结果 。 因 此 ，24% 的 命中 率 高 于 平均 水 平 ， 但 还 不 至 于 不 同 
寻常 到 让 我 现在 就 将 这 一 情况 上 报国 家 。 

如 果 你 试验 超过 25 次 , 那么 命中 率 如 何 ” 表 6-17 展 示 了 正确 猜 中 给 定 百分比 (或 更 高 百分比 ) 
的 几率 。 此 表 假 设 预期 命中 率 为 20%。 

















表 6-17: 选 定 的 ESP 命 中 率 的 可 能 性 





猜测 数 正确 百分比 〈 命 中 率 ) 达到 或 超过 命中 率 的 可 能 
25 20% 50% 

25 30% 11% 

25 40% 1% 

25 50% 0.01% 

100 20% 50% 

100 30% 1% 

100 40% 0.000 01% 

100 50% 0.000 000 000 001% 








注意 ， 随 着 样本 容量 增 大 , 极端 结果 的 可 能 性 大 幅 下 降 。 例如， 只 有 25 次 猜测 时 ， 获 得 40% 命 
中 率 的 几率 约 为 1%; 如 果 你 遍历 25 张 牌 100 次 ， 你 很 可 能 只 有 1 次 会 做 得 那么 好 或 更 好 。 但 是 ， 如 
果 你 猜 100 次 ， 也 许 遍 历 25 张 卡 牌 4 次 ， 你 得 到 40% 或 更 高 正确 率 的 几率 仅 有 1/100 000 000 000 0001 











6.8.3 多少 才 够 


如 果 你 想 进 行 ESP 实 验 ， 你 应 该 建立 一 个 标准 : 一 个 现象 的 不 可 能 性 必须 达到 什么 水 平 ， 你 
才 考 虑 将 其 作为 有 表面 几率 之 外 的 东西 在 发 挥 作用 的 证 据 。 通 常情 况 下 , 在 统计 研究 中 ,如 果 结 
果 偶 然 发 生 的 几率 为 5% 或 更 小 , 其 结果 就 被 视 为 统计 显著 。 对 于 有 25 张 齐 纳 卡 和 25 次 猜测 的 ESP 
实验 , 你 猜 对 8 个 或 更 多 卡 的 概率 约 为 7%。 你 猜 对 9 个 或 更 多 卡 的 几率 只 有 2%。 因 此 , 某 个 介 于 8 
至 9 的 命中 标准 是 科学 合理 的 。 


我 内 心 的 怀疑 感 迫使 我 必须 给 你 一 个 警告 。 如 果 你 进行 这 个 实验 , 在 你 自己 身上 或 别人 身上 
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获得 了 显著 结果 ,这 是 很 酷 的 。 但 是 ， 如 果 你 能 重复 这 一 发 现 ,在 同一 个 人 身上 复制 实验 并 获得 
相似 结果 , 这 将 使 一 切 变 得 精彩 ! 如 果 出 现 这 种 情况 ,立刻 给 我 发 电报 ,我 会 卖 掉 我 的 房子 投身 
其 中 ， 我 们 将 踏 上 名 利之 路 ! 


网 6.9 ”治愈 合 选 症 
| #469 OTE TO ETO 
出 人 意料 的 有 是， 人们 常常 意识 不 到 这 个 常识 性 真理 。 











试想 一 下 ,在 一 次 晚 实 上 ， 朋 友 将 你 介绍 给 约翰 ,他 是 一 个 令 人 愉快 、 身 材 高 大 且 稳 重 的 男 
子 。 你 与 约翰 闲聊 了 几 分钟 ， 发 现 他 很 友好 、 很 爱 笑 ， 但 不 是 很 聪明 。 约 翰 急 于 谈论 目前 正在 进 
行 的 世界 职业 棒球 大 赛 ， 也 问 你 开 什 么 车 。 

晚宴 结束 , 在 回 家 的 路 上 , 你 的 爱人 询问 晚饭 前 和 你 交谈 的 那个 人 的 情况 。 你 分 享 了 约翰 的 

点 信息 ,但 意识 到 自己 从 未 了 解 他 是 做 什么 的 。 事 实 上 , 正如 你 意识 到 的 一 样 ， 你 知道 的 关于 
他 的 信息 真是 太 少 了 。 你 的 爱人 决定 和 你 玩 一 个 小 智力 游戏 ， 并 解释 道 : 











我 对 约翰 有 所 了 解 。 我 会 提供 一 系列 关于 他 的 陈述 。 它 们 可 能 是 真 的 ， 也 可 能 是 假 
的 。 所 有 陈述 都 可 能 是 真 的 ， 也 都 可 能 是 假 的。 这 些 陈述 也 可 能 是 真 假 混合 的 。 我 希望 
你 基于 自己 对 每 个 陈述 为 真 的 信心 大 小 ， 对 它们 进行 排序 。 当 我 们 完成 后 ， 我 将 诊断 你 
是 否 患 有 一 种 称 作 合 选 症 ( Conjunctionitus ) 的 常见 脑 疾病 。 
然后 ， 你 的 爱人 要 求 你 对 如 下 关于 约翰 的 陈述 排序 ， 猜 测 哪个 最 有 可 能 是 真 的 : 

(1) 约翰 是 计算 机 科学 家 ; 
(2) 约翰 是 汽车 推销 员 ; 


是 
是 

(3) 约翰 是 前 棒球 运动 员 ; 
是 








(4) 约翰 是 共和 党 人 ; 

(5) 约翰 曾经 是 打 棒 球 的 计算 机 科学 家 

(6) 约翰 是 跑马 拉 松 的 传教 士 ; 

(7) 约翰 演奏 单 赞 管 ; 

(8) 约翰 结婚 了 。 

像 很 多 人 一 样 ， 你 可 能 会 把 陈述 3 ( 前 棒球 运动 员 ) 列 为 最 有 可 能 为 真 的 陈述 之 一 ， 把 陈述 1 
(计算 机 科学 家 ) 列 为 最 不 可 能 的 。 到 目前 为 止 ， 陈 述 内 容 还 没有 那么 疯狂 ， 至 少 它们 都 是 基于 
你 刚才 谈话 的 合理 猜测 。 

你 的 合 选 症 症状 ， 与 你 分 配给 陈述 5 的 排名 位 置 有 关 。 我 打赌 你 把 它 排 在 陈述 1 的 前 面 ,认为 
其 可 能 性 大 。 如 果 是 这 样 ， 那 你 可 能 患 有 合 选 定 : 一 种 导致 人 们 作出 粮 糕 的 概率 判断 的 症状 。 
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事实 是 ， 两 个 事件 一 起 发 生 的 概率 永远 不 会 大 于 任何 单独 一 个 事件 发 生 的 概率 。 因 此 ,“ 约 
输 曾 经 是 打 棒 球 的 计算 机 科学 家 ”不 会 比 “ 约 翰 是 计算 机 科学 家 ”更 有 可 能 。 但 是 ， 不 要 害怕 ， 
在 这 种 情况 下 ,， 若 要 提高 你 作出 可 能 性 判断 的 能 力 ， 第 一 步 是 承认 你 有 问题 。 接 下 来 的 步 又 是 了 
解 状况 ， 然 后 就 可 以 开始 治疗 了 。 












































6.9.1 问题 


虽然 更 多 的 信息 可 能 使 一 个 描述 看 起 来 与 某 人 或 某 事 更 加 相似 ， 或 对 某 人 或 某 事 更 具 代表 
性 ,但 是 更 多 的 信息 不 会 使 事情 更 有 可 能 。 如 前 面 提 到 的 ， 两 个 事件 一 起 发 生 的 概率 不 会 比 它 们 
中 的 一 个 单独 发 生 的 可 能 性 高 。 考 虑 一 个 人 在 这 个 世界 上 的 所 有 可 能 事件 。 你 如 何 决定 约翰 的 哪 
些 事情 是 最 有 可 能 的 ? 你 可 以 从 观察 基础 概率 开始 。 


在 这 个 世界 上 ， 相 比 计算 机 科学 家 、 汽 车 销售 员 、 前 棒球 选手 、 共 和 党 人 、 传 教士 、 马 拉 松 
运动 员 和 单 签 管 玩家 , 已 婚 男人 的 数量 可 能 更 多 。 因 此 ,很 有 可 能 约翰 已 经 结婚 了 。 你 把 这 个 可 
能 性 排 在 哪里 ? 

因为 我 们 可 能 真 的 不 知道 所 有 其 他 可 能 性 的 基础 概率 , 所 以 我 们 可 以 使 用 关于 约翰 的 已 知 信 
息 去 预测 哪些 陈述 是 最 有 可 能 的 。 我 们 明确 知道 ， 如 果 考 虑 包含 所 有 前 棒球 选手 的 群 组 和 包含 所 
有 计算 机 科学 家 的 群 组 ,大概 只 有 少数 人 同属 于 这 两 个 群体 。 因 此 ,在 曾经 打 棒球 的 计算 机 科学 
家 群体 中 的 可 能 性 ， 一 定 比 在 计算 机 科学 家 群 组 或 在 前 棒球 选手 组 的 可 能 性 要 小 。 

但 是 ,大 多 数 人 ， 即 使 他 们 是 理性 的 、 悦 明 的 决策 者 ， 也 会 被 拉 向 合 选 的 句子 ( 即 列 出 两 个 
独立 “事实 ”的 句子 ) 仿佛 将 “事实 ” 列 在 一 起 使 它们 更 可 能 是 真 的 。 即 使 (也 许 尤其 是 ) 第 
二 个 “事实 ”本 身 似乎 就 不 太 可 能 的 情况 下 。 




























































































6.9.2 ” 合 选 连结 的 原理 


为 什么 我 们 的 头脑 往往 以 这 种 方式 工作 ? 20 址 纪 70 年 代 , 诺 贝尔 奖 得 主 丹 尼 尔 * 卡 尼 曼 和 他 
的 同事 阿 莫 斯 ， 特 沃 斯 基 给 大 学 生 展 示 了 几 个 问题 ， 其 中 一 个 选项 高 度 代表 一 个 给 定 的 个 性 
描述 ， 一 个 选项 与 描述 不 一 致 ， 一 个 选项 包括 高 度 相似 和 不 一 致 这 两 个 选项 。 


也 许 最 众所周知 的 、 反 映 合 选 刻 误 的 著名 问题 ( 至 少 在 认 知 心理 学 界 ) 是 琳 达 问题 : 


琳 达 31 岁 ,单身 、 直 率 ， 也 很 聪明 。 她 主 修 哲 学 。 作 为 一 名 学 生 ， 她 深切 关注 歧视 和 社会 公 
正 问题 ， 而 且 她 还 参加 了 反 核 示威 游行 。 


被 试 需要 判断 下 列 陈 述 为 真 的 可 能 性 ， 并 按 高 低 顺序 进行 排列 


(1) 琳 达 是 一 名 小 学 教师 ; 
(2) 琳 达 在 书店 工作 ， 还 参加 瑜伽 课程 ; 






































(3) 琳 达 在 女权 运动 中 很 活跃 

(4) 琳 达 是 一 位 精神 科 社 会 工作 者 ; 

(5) 琳 达 是 妇女 选民 联盟 的 成 员 ; 

(6) 琳 达 是 银行 柜员 ; 

(7) 琳 达 是 保险 推销 员 ; 

(8) 琳 达 是 银行 柜员 ， 并 积极 参与 女权 运动 。 

卡 尼 曼 和 特 沃 斯 基 ( 和 许多 其 他 曾经 复制 过 此 研究 的 人 ) 发 现 ， 人 们 一 致 都 把 选项 8 ( 积极 
参与 女权 运动 的 银行 柜员 ) 视 为 更 有 可 能 ， 将 其 排 在 选项 6 ( 银行 柜员 ) 之 前 。 这 是 因为 选项 8 
提供 了 更 多 的 信息 ,看 起 来 更 能 代表 琳 达 。 因 为 我 们 期 望 她 在 政治 上 活跃 , 但 我 们 不 指望 她 是 一 
个 银行 柜员 ， 她 看 起 来 会 是 银行 柜员 的 唯一 途径 是 : 她 也 积极 参与 政治 活动 。 

然而 ,我们 知道 ， 选 项 8 不 会 比 选项 3 或 选项 6 的 可 能 性 大 ， 因 为 如 果 我 们 想象 所 有 活跃 在 女 
权 运 动 中 的 人 , 他们 ( 也许 是 一 个 小 的 子 集 ) 的 一 个 子 集 是 银行 柜员 。 同 样 ， 如 果 我 们 想象 世界 
上 所 有 的 银行 柜员 ,一 个 子 集 (同样, 也许 是 一 个 小 的 子 集 ) 活跃 在 女权 运动 中 。 因 此 ， 作 为 一 
个 银行 柜员 的 可 能 性 要 大 于 作为 活跃 在 女权 运动 的 银行 柜员 的 可 能 性 。 有 道理 吧 , 对 不 对 ?但 你 
的 思维 不 以 这 种 方式 运转 。 





















































x 两 个 事件 一 起 发 生 的 概率 无 法 大 于 其 一 发 生 的 概率 ， 这 被 称 为 合 选 规则 。 很 多 人 往 
往 认 为 合 选 的 两 个 事件 有 时 会 比 单独 一 个 事件 发 生 的 可 能 性 大 , 这 种 事实 被 称 为 合 
选课 误 。 


停止 错误 地 思考 这 类 命题 ， 治 愈 方法 很 简单 ; 

(1) 别 说 了 ; 

(2) 停 下 来 ; 

(3) 不 要 那样 做 。 

合 选 恋 误 可 以 在 工作 的 许多 地 方 看 到 。 注 意 它 可 能 发 生 的 情境 ， 并 分 析 该 情境 。 例 如 ， 你 可 
以 向 一 个 棒球 迷 询 问 他 喜爱 的 且 经 常 打 不 出 本 人 垒 打 的 球员 的 情况 。 询问 他 该 球员 是 否 在 接 下 来 的 
比赛 更 有 可 能 作出 如 下 哪 件 事 情 : 
口 打出 一 个 本 双打 ; 
口 出 局 ; 
口 出 局 并 打出 一 个 本 双打。 
粉丝 可 能 认为 , 在 比赛 中 , 一 个 本 低 打 加 一 个 出 局 比 仅仅 一 个 本 人 又 打 的 可 能 性 要 大 。 但 事实 
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不 是 这 样 的 。 


x 有 一 些 情况 下 ， 选 择 合 选 命题 可 能 也 可 以 。 如 果 两 件 事情 必须 一 起 出 现 ( 如 电 闪 雷 
鸣 )， 那 么 两 者 都 发 生 的 可 能 性 和 它们 其 中 之 一 发 生 的 可 能 性 一 样 。 如 果 你 增加 关 
于 雷鸣 和 闪电 的 陈述 ， 并 对 比 雷鸣 (没有 闪电 ) 与 电 闪 雷鸣 的 可 能 性 ， 那么， 其实， 
电 闪 雷鸣 的 可 能 性 会 更 高 。 然 而 ， 这 只 适用 于 如 果 没 有 另 一 个 ， 这 一 个 也 永远 不 会 
发 生 的 情况 。 
一 旦 意识 到 这 个 概率 估计 的 常见 错误 ， 你 会 发 现 它 无 处 不 在 。 例 如 ,你 可 以 很 容易 地 在 政治 
预测 舞台 上 找到 合 选 廖 误 。 乔 治 .，W. 布什 更 倾向 于 : 
口 提名 一 位 温和 的 最 高 法 院 法 官 ; 
口 提名 一 位 温和 的 最 高 法 院 法 官 和 一 个 右翼 最 高 法 院 法 官 。 
当然 ， 你 现在 知道 答案 了 ,但 许多 政治 分 析 家 可 能 会 和 你 争论 , 那 是 因为 他 们 有 病 。 他 们 有 
合 选 症 。 你 曾经 也 有 病 ， 但 现在 治愈 了 。 
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i J 6.10 用 Etaoin Shrdlu3 破 解密 码 
本 人 旧作 从 未 都 不 知道 什么 时 候 你 将 不 得 不 破译 一 个 密码 ， 不 论 它 来 自 男 神 庆 丝 斯 . 故 德 的 
拦截 消息 ,还 是 你 的 医生 字 和 证 洪 草 难 以 状 认 的 处 方 慨 。 以 下 是 你 了 所 需 的 所 有 统计 技巧 ， 
代号 为 003.14159。 
你 可 能 已 经 注意 到 , 你 电脑 键盘 上 的 某 些 键 比 其 他 键 在 更 短 的 时 间 内 变 脏 或 磨损 。 那 是 因为 
你 敲 击 它们 的 次 数 比 其 他 键盘 更 多 。 你 可 能 还 注意 到 , 这些 字母 往往 在 键盘 中 间 , 或 者 更 确切 地 
说 ， 当 你 的 手 放 在 键盘 正中 时 ， 它 们 在 你 手 附近 的 小 圆圈 里 。 
磨损 的 按键 及 其 在 标准 打字 机 中 的 位 置 ( 又 名 QWERTY， 顶 行 前 6 个 字母 ) 都 是 基于 它们 在 
英语 中 的 使 用 频率 而 定 的 。 字母 表 中 的 不 同 字母 在 语言 拼写 中 的 使 用 频率 是 不 同 的 。 通过 运用 这 












































注 3: Etaoin Shrdlu 是 本 行 作废 的 意思 ， 此 处 指 用 这 儿 个 字母 来 破解 密码 。 








译 者 注 





6.10 用 Etaoin Shrdlu 破解 密码 251 





些 字母 的 已 知 频 率 及 其 他 统计 技巧 , 你 可 以 快速 解码 机 密 文件 , 无 论 它们 是 达 芬 奇 的 日 记 、 报 纸 
上 的 谜 题 ， 还 是 在 电视 上 被 Vanna White 翻转 的 、 大 而 明亮 的 字母 。 





6.10.1 单 替 换 密码 


最 简单 且 最 古老 的 以 字母 为 基础 的 代码 类 型 是 单 蔡 换 形 式 。 在 这 些 代 码 中 , 一 些 消息 单词 的 
实际 字母 被 转化 为 字母 表 中 的 其 他 字母 。 用 这 种 方式 编码 的 最 简单 形式 是 , 整个 消息 中 的 相同 字 
母 被 替换 为 同一 个 字母 。 例 如 ， 一 个 简单 的 密码 文 可 以 使 用 表 6-18 所 示 的 替代 方式 ， 其 中 上 面 一 
行 的 字母 ( 原文 本 ) 被 底部 一 行 〈 密码 文本 ) 的 字母 取代 。 


























表 6-18: 单 蔡 换 密码 
原文 本 |A BB CDEFGHYI JKLMNOPOQORS TUYVWX YZ 


密码 文本 NAOB PCQD RE S F TG NU HYV I VW J x KY L 2 M 


有 了 表 6-18 这 样 的 代码 ， 以 下 的 原文 本 段落 : 





Tom appeared on the sidewalk with a bucket of whitewash and long-handled brush. 
以 密码 文本 表示 就 是 这 样 的 : 
Jut nhhpnipb ug jdp wrbpynfs yrjd n axospj uc ydrjp yhwd ngb u fugq-dngbfpb aixwd. 


这 段 话 看 起 来 毫 无 意义 ,但 有 了 表 6-18 所 示 的 线索 ,任何 人 都 可 以 轻松 地 把 无 意义 的 字母 替 
换 为 原来 的 字母 ， 这 样 《汤姆 : 索 亚 历险 记 》( Tom Sawyer ) 第 2 章 第 2 段 的 开头 就 显示 出 来 。 

















6.10.2 ”用 概率 来 解码 替换 密码 
当然 ,破译 密码 时 ,真正 的 任务 是 没有 代码 线索 的 。 现 实生 活 中 的 代码 破解 人 员 和 幸运 之 轮 
的 获奖 选手 使 用 相同 的 工具 来 解决 他 们 的 问题 : 他 们 运用 英语 单词 中 字母 的 已 知 分 布 。 


电脑 、 电 脑 分 析 和 数 百 万 电子 书籍 的 出 现 , 已 经 使 计算 字母 表 中 的 每 个 字母 的 确切 概率 成 为 
可 能 ， 虽 然 密码 学 家 ( 代码 制造 者 和 破解 者 ) 已 经 知道 这 些 基 础 知识 很 长 时 间 了 。 下 面 是 其 中 的 
些 } 























口 英语 中 ， 最 常 使 用 的 字母 是 E; 

口 最 不 常 使 用 的 字母 是 Z; 

口 最 常用 的 辅音 是 T; 

口 J 和 XX 与 很 少 被 用 到 ，Q 也 一 样 ; 

口 当 Q 被 使 用 时 ， 几 乎 总 是 伴随 着 U; 
































252 第 6 章 精明 思考 (Hack #61~#75 ) 








D 在 英语 中 ， 只 有 A 和 I 作为 单个 字母 构成 的 单词 来 使 用 。 

哪怕 只 掌握 这 些 基础 概率 事实 ， 你 也 可 以 开始 着 手 对 一 个 密码 进行 解码 ， 如 我 们 的 马克 ， 吐 
温 段 落 。 在 乱码 版 本 中 ,最 常 出 现 的 字母 是 P 和 N。 因 为 N 是 一 个 单一 字母 的 单词 ， 所 以 它 不 能 是 
E (NN 最 有 可 能 是 A )， 所 以 对 P 替 代 字 母 的 最 优先 猜测 是 E。 





















































但 像 任何 优秀 的 统计 学 家 一 样 ， 我 们 认为 自己 可 能 是 正确 的 。 表 6-19 显 示 了 字母 表 中 每 个 字母 的 
可 能 分 布 。 


表 6-19: 英语 中 字母 的 频率 分 布 
母 频 率 
8.04% 
1.54% 
3.06% 
3.99% 
12.51% 
2.30% 
1.96% 
5.49% 
7.26% 
0.16% 
0.67% 
4.14% 
2.53% 
7.09% 
7.60% 
2.00% 
0.11% 
6.12% 
6.54% 
9.25% 
2.71% 
0.99% 
1.92% 
0.19% 
1.73% 
0.09% 





Nx 二 <C I OTOZZTRT TATTHU NWI 
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6.10.3 ETAOIN SHRDLU 








奇怪 的 短语 “ETAOIN SHRDLU” 是 一 种 帮助 我 们 记 住 最 频繁 出 现 字母 的 记忆 口诀 (记忆 方 
法 )。 这 12 个 字母 占 全 部 字母 出 现 频率 的 80% 以 上 。 

你 可 能 已 经 注意 到 ， 在 ETAOIN SHRDLU 中 ， 字 母 顺序 并 不 完全 与 表 6-19 所 示 排 名 一 致 。 但 
顺序 足够 接近 ,并 且 读 起 来 比 完 全 正确 的 排序 更 容易 。 另 一 件 要 记 住 的 事 是 ,任何 “最 终 的 ” 字 
母 概 率 列表 取决 于 字母 计数 的 来 源 材料 。 你 可 以 找到 许多 不 同 的 字母 排序 和 频率 列表 , 其 中 一 些 
和 其 他 的 稍 有 不 同 。 

例如 ， 一 个 制作 英语 文本 中 字母 使 用 统计 分 布 列表 的 组 织 ， 其 结论 来 源 于 对 7 本 文学 名 著 的 
计算 机 分 析 以 及 实际 的 字母 出 现 次 数 , 妇 《 简 爱 》( Jane Eyre ) 和 和 呼啸 山庄 》( Withering Heights )。 
7 本 书 中 两 本 是 关于 人 猿 泰 山 ( Tarzan ) 的 小 说 。 我 猜 ， 如 果 我 们 比较 这 张 表 和 其 他 表 的 字母 分 
布 ， 我 们 会 发 现 ， 这 张 表 显示 的 字母 Z 出 现 的 比例 大 于 使 用 其 他 来 源 的 表 。 但 是 ， 对 于 常见 的 字 
母 ， 比 如 E、T 和 A， 对 于 它们 作为 密码 破译 的 首选 猜测 字母 ， 人 们 已 经 形成 广泛 的 共识 。 

































































幸运 之 轮 策 略 
电视 节目 真人 秀 《 幸 运 之 轮 》( Wheel of Fortune ) 中 ， 在 最 后 解决 大 难题 之 前 ， 友 好 的 制 
片 人 会 提供 某 些 字母 ， 并 显示 字母 是 否 出 现在 剑 子 手 式 的 短语 中 。 他 们 提供 R、S、T、L、N 
和 E。 当 然 ， 给 定 这 些 字母 是 因为 它们 非常 常见 ， 并 在 我 们 的 前 12 名 中 : ETAOIN SHRDLU。 
玩家 被 允许 再 选择 3 个 辅音 和 另外 1 个 元 音 。 利 用 我 们 的 字母 频率 统计 知识 ,一 个 较 好 的 基本 策 








略 是 : 选择 A 作 为 元 音 ， 并 选择 H、D 和 C 这 3 个 最 常见 且 尚 未 出 现 的 辅音 。 





6.10.4 ”编码 文本 的 统计 分 析 


下 面 是 如 何 使 用 这 些 字母 统计 量 在 现实 生活 中 解码 秘密 消息 或 解决 一 个 难题 。 如 果 编 码 的 文 
本 很 长 ， 这 方法 效果 最 好 ， 但 是 它 对 较 短 一 些 的 段落 发 挥 出 效果 也 足以 令 人 吃惊 。 计 算 编 码 的 、 
替换 的 字母 〈 蜜 码 文本 ) 分 布 ， 然 后 把 它 和 表 6-19 所 示 的 分 布 进行 对 比 。 
图 6-8 使 这 个 方法 的 表述 更 为 形象 。 该 图 只 展示 了 前 10 个 最 常见 的 字母 ， 但 分 析 中 会 使 用 所 
有 的 字母 。 这 个 例子 假设 表 6-18 所 示 的 编码 文本 和 替代 密码 被 大 量 使 用 。 

因为 最 常见 的 替代 字母 为 P， 其 次 为 J， 所 以 破解 代码 时 ， 首 先 猜 测 P 是 否 真 的 代表 忆 ， 以 及 了 
是 否 真 的 代表 T。 可 以 沿 直线 往 下 逐个 猜测 每 一 字母 。 从 最 频繁 出 现 的 字母 开始 ， 向 列表 下 方 移 
动 , 一 名 密码 破解 人 员 可 以 很 快 看 出 这 些 猜测 是 否 正确 ,他们 不 断 改 变 猜测 ,直到 英语 单词 开始 
出 现 。 
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英文 字母 分 布 编码 字母 分 布 
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图 6-8: 英文 字母 频率 ( 左 ) 和 编码 字母 频率 ( 右 ) 
6.10.5 其 他 常见 的 字母 模式 
除了 知道 个 别 字母 的 出 现 频率 ， 优 秀 的 密码 破译 者 还 使 用 其 他 的 字母 模式 信息 。 
口 单词 最 有 可 能 以 T、O、A、W 或 B 开 头 。 
口 大 多 数 的 单词 以 E、T、D 或 $ 结 尾 。 
口 如 果 某 个 字母 在 单词 里 连续 出 现 两 次 ， 它 们 最 有 可 能 是 SS、EE、TT 、FF 或 LL。 
口 频繁 出 现 的 两 字母 单词 包括 of、to 、in 和 is。 
口 到 目前 为 止 , 最 常见 的 三 字母 单词 是 the 和 and; 其 他 较 常见 的 三 字母 单词 包括 for、are 和 but。 
口 往往 成 对 出 现 的 字母 包括 TH、HE、AN 、IN 和 ER。 
口 最 常 使 用 的 单词 是 the、of、 and、 to、in、a、is、that、be 和 it。 
口 也 许 还 能 指出 哪些 单词 是 人 们 常 写 的 ， 在 书面 文本 中 ， 最 常用 的 前 100 个 词 包 括 dollars、 
great、general 和 public。debts 差 一 点 就 能 进入 前 100 名 ， 但 它 也 很 常见 。 









































6.10.6 参阅 


口 一 个 很 好 的 关于 单 蔡 换 密 码 的 解释 可 以 在 http:/en.wikipedia.org/wiki/Frequency _ analysis 网 
站 的 频率 分 析 条 目 中 找到 。 

口 本 Hack 涉 及 的 一 些 统计 数据 可 以 在 http:/www.data-compression.com 和 http://www.scottbryce. 
com 找 到 。 你 还 可 以 在 这 个 网 站 上 找到 关于 如 何 使 用 统计 来 解决 密码 电文 和 其 他 代码 的 有 用 
信息 和 建议 。 














TD 6.11 发 现 一 个 新 物种 
#71 嘿 瑟 每 天 都 有 物种 走 铅 灭 绝 ， 但 偶尔 还 是 会 发 现 未 知 的 新 物种 。 出 人 意料 的 是 ， 利 用 
统计 方法 而 不 是 生物 方法 ， 可 以 达到 鉴别 物种 的 目的 。 
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几 年 前 ,一 个 新 的 负 鼠 物种 被 确认 。 这 个 新 物种 被 命名 为 trichosurus cunninghamii。 Trichosurus 
代表 ， 咽 ……… 负 鼠 (我 猜 的 )，cunninghamii 部 分 代表 它 的 发 现 者 ， 罗 丝 : 坎 宁 汉 (了 Ross 
Cunningham ), 一 位 澳大利亚 国立 大 学 的 统计 学 家 。 如 果 你 想 有 一 个 因 你 命名 的 物种 ,可 以 接受 
统计 提供 的 帮助 。 





6.11.1 用 统计 鉴定 物种 

有 一 大 族 系 的 统计 分 析 方 法 ,它们 着 眼 于 一 堆 变 量 并 发 现 变量 中 自然 出 现 的 分 组 ,通常 来 说 ， 
变量 分 组 或 集群 的 鉴定 依据 它们 之 间 的 相关 性 [Hack #11]。 

有 一 种 使 用 这 种 策略 的 方法 , 它 试 图 找 出 相关 的 维度 , 或 无 形 的 、 能 解释 一 堆 不 太 重要 变量 
的 大 型 基础 变量 。 这 种 方法 就 是 因素 分 析 , 我 们 已 经 在 其 他 章节 看 到 它 如 何 识 别 作 家 的 写作 风格 
[Hack #65]， 除 此 之 外 ， 它 还 有 其 他 用 途 。 

统计 学 充满 了 类 似 的 技术 ,可 以 识别 出 维度 、 根 本 原因 ,还 有 分 组 。 对 于 有 生物 倾向 的 、 愿 
意识 别 新 物种 的 统计 学 家 来 说 ， 确 定 分 组 的 目标 是 非常 有 用 的 。 

从 技术 上 来 说 ， 如 果 某 组 动物 属于 一 个 独立 的 物种 ， 那 它们 必须 共享 唯一 的 一 组 生物 特点 ， 
使 其 区 别 于 同类 动物 。 当 然 ， 同 一 科 属 的 动物 都 长 得 略 有 不 同 , 但 男 一 方面 ， 人 和 人 之 间 有 很 多 
的 不 同 ， 但 我 们 都 是 同一 物种 ( 我 的 叔叔 弗兰克 的 存在 或 许 能 证 明 这 一 规则 也 有 例外 )。 

如 果 一 组 动物 , 如 坎 宁 汉 博 士 的 负 鼠 , 它们 之 间 的 共同 点 比 与 同 科 属 的 其 他 生物 的 共同 点 要 
多 , 那 它们 有 权 将 自己 看 做 一 个 候选 新 物种 。 统 计 可 以 确定 “它们 彼此 之 间 更 相像 ， 与 其 他 物种 
的 差异 比 仅 靠 几率 产生 的 更 多 ”的 临界 点 在 哪里 。 

将 坎 宁 汉 的 发 现 作为 一 种 模型 ， 你 要 实现 自己 的 发 现 ， 下 面 有 几 个 步骤 要 遵循 。 

1. 收集 数据 

这 种 负 鼠 已 经 在 澳大利亚 人 的 眼皮 底下 存在 200 年 以 上 , 但 没有 人 注意 到 。 实话 实 说 , 它 看 上 
去 非常 像 其 他 的 负 鼠 ， 其 中 最 常见 的 是 trichosurus caninus ， 现 在 叫 短 耳 负 鼠 ( short-eared possum )。 

有 一 段 时 间 , 人 们 认为 这 些小 家 伙 真 的 只 有 一 个 品种 。 坎 宁 汉 博士 的 一 部 分 工作 是 收集 和 整 
理 他 周围 野生 动物 的 描述 性 数据 。 因 此 ,他 有 大 量 的 、 关 于 各 种 负 鼠 身体 各 部 分 的 、 非 常 具体 的 
定量 描述 ， 眼 睛 、 耳 杀 、 鼻 子 和 喉 咕 ， 还 有 其 他 的 物理 测量 。 

2. 选择 统计 方法 

坎 宁 汉 选 择 了 一 种 和 因素 分 析 相 似 的 技术 ， 但 它 有 一 个 更 具 气 势 的 名 称 : 典型 变量 分 析 
( canonical variate analysis )。 你 可 以 采用 使 用 变异 分 数 的 任何 方法 来 创建 不 同 的 组 。 其 中 一 些 在 
本 书 中 有 讨论 ， 比 如 因素 分 析 ， 本 Hack 之 前 的 章节 也 提 到 了 很 多 其 他 有 效 的 方法 。 
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” ”如果 你 真 的 是 擅 于 统计 的 人 ， 那 么 知道 典型 变量 分 析 和 判别 分 析 ( discriminant 
analysis ) 及 多 元 方差 分 析 (or multivariate analysis of variance，MANOVA ) 具有 功 
能 上 的 一 致 性 会 对 你 有 益 , 判别 分 析 和 多 元 方差 分 析 是 另外 两 个 用 于 创建 线性 复合 

变量 的 方法 ， 目 的 是 定义 两 个 或 两 个 以 上 截然 不 同 的 群体 。 





坎 宁 汉 用 这 种 统计 方法 检验 这 个 假定 的 单一 物种 ( 你 知道 的 ， 就 是 trichosurus caninus 负 鼠 ) 
的 描述 性 数据 ， 并 证 明 它们 可 能 是 两 个 不 同 的 物种 。 

3. 选择 一 个 假设 并 分 析 数 据 

统计 学 家 检验 假设 , 所 以 你 应 该 在 开始 分 析 时 就 作出 这 样 的 猜测 : 提供 给 你 数据 的 族群 之 间 
是 否 存 在 区 别 。 

在 我 们 的 成 功 案例 中 , 坎 宁 汉 假 设 数据 来 自 两 个 不 同 的 物种 群体 。 那 么 ， 该 方法 ( 当然 , 用 
计算 机 进行 计算 ) 可 以 确定 哪些 变量 作为 理论 组 之 间 的 主要 区 别 特征 效果 最 好 。 


























测 时 ， 研 究 者 有 一 些 关于 实际 科 属 分 数 的 已 知 数据 ， 即 它们 属于 [Hack #13] 哪 个 
“组 ”。 这 里 的 方法 是 在 不 知道 正确 答案 的 情况 下 摸索 地 进行 。 相反， 它 可 以 找 出 与 
手头 的 变量 最 不 同 的 群 组 。 


x 使 用 典型 变量 分 析 和 其 他 类 似 回 归 工 具 的 区 别 是 , 当 在 回归 分 析 中 使 用 交 量 进行 预 








下 面 是 坎 宁 汉 使 用 的 变量 : 
口头 长 ; 
口 头骨 宽度 ; 
口 眼睛 大 小 ; 
口 耳 长 ; 
口 体 长 〈 从 鼻子 到 卷曲 的 尾巴 的 尖端 ) 
口 尾 长 ; 
口 胸 宽 ; 
口 足 长 。 
虽然 还 考虑 了 其 他 变量 , 但 坎 宁 汉 选 择 这 些 特 征 是 因为 最 终 发 现 它 们 是 区 分 不 同 物种 的 最 重 
要 的 方面 ， 并 且 这 些 特征 可 能 不 受 环境 影响 。 


4. 解释 结果 
任何 统计 分 析 的 最 后 一 步 都 是 描述 和 理解 你 的 发 现 。 对 于 发 现 新 物种 来 说 , 你 需 能 足够 详细 
地 描述 新 物种 ， 以 把 它 和 其 他 同类 物种 区 分 开 来 。 
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坎 宁 汉 使 用 的 方法 确定 了 由 不 同 权重 的 生物 变量 组 成 的 一 系列 方程 , 目的 是 找到 最 能 识别 两 
个 不 同 组 群 的 组 合 。 这 些 方程 ( 该 方法 将 其 称 作 变 量 ) 类 似 于 回归 方程 ， 结 果 或 标准 变量 用 来 确 
定 负 鼠 属 于 哪个 组 。 
下 面 是 一 个 最 好 的 公式 ， 能 够 解释 数据 库 中 高 达 89% 的 负 鼠 特征 差异 : 
( 头 长 x0.44 )+( 头骨 宽 度 x0.07 )+( 眼 睛 大 小 x0.05 )+( 耳 长 x0.82 )+( 体 长 x0.35 ) 
+( 尾 长 x0.72 ) +( 胸 宽 x0.16) +( 足 长 x0.70 ) 


我 已 经 提供 了 研究 中 标准 化 的 权重 , 因此 我 们 可 以 将 它们 进行 相互 比较 。 最 大 的 权重 代表 负 
鼠 的 这 个 身体 部 位 在 数学 选择 的 两 组 负 鼠 间 最 为 不 同 。 

在 这 个 公式 中 ,你 会 发 现 两 组 负 鼠 的 耳 长 、 尾 长 和 足 长 最 不 相同 。 从 统计 学 上 来 说 ， 变 异 的 
解释 量 是 如 此 之 大 , 以 至 于 坎 宁 汉 认为 数学 上 确定 的 这 种 分 组 是 真实 的 。 从 数据 中 发 现 的 两 组 负 
鼠 实 际 上 是 两 个 不 同 的 负 鼠 物种 ,而 这 个 物种 可 以 通过 它们 的 耳 长 和 其 他 几 个 变量 来 定义 。 前 面 
所 示 公 式 的 权重 越 大 ， 两 个 物种 在 这 些 身体 部 位 上 的 差异 就 越 大 。 


















































6.11.2 ”两 个 负 鼠 物种 


表 6-20 显 示 了 由 我 们 的 统计 学 家 和 他 的 数学 首次 确认 的 两 个 负 鼠 物种 的 官方 描述 。 注 意 ， 
们 甚至 都 是 基于 统计 分 析 中 发 现 的 关键 预测 变量 来 命名 的 ! 


[二 





表 6-20: 两 种 常见 的 澳洲 负电 














trichosurus caninus trichosurus cunninghamii 
通用 名 称 短 耳 负 鼠 山 刷 尾 负 鼠 
居住 地 北方 南方 
耳 打 短 耳 长 耳 
足 小 足 大 足 
关 大 头 小 头 
尾巴 长 尾 短 尾 











那么 , 现在 开始 收集 你 在 纱 门 上 发 现 的 那些 奇怪 的 、 散 发 恶 自 的 昆虫 数据 吧 ， 这样 你 就 路上 
通 向 伟大 和 不 朽 的 道路 了 。 亚 具 的 昆虫 是 一 个 物种 还 是 两 个 ”你 来 告诉 我 。 


























6.11.3 ”参阅 


我 在 这 篇 美妙 的 文章 里 第 一 次 了 解 了 这 种 鉴定 物种 的 方法 : Hall, P. (2003).Chance, 16, 1 。 
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J 6.12 互联 
, # “六 度 分 隔 ” 约 概念 不 仅 是 对 社区 约 一 种 新 时 代 比 喻 ， 识 代表 演员 凯 文 . 贝 肯 举办 约 
聚会 游戏 。 如 果 你 想 实 际 地 测试 我 们 都 认识 某 个 人 ， 而 这 个 人 认识 其 他 所 有 人 这 一 
观念 ， 我 出 你 和 大 家 紧密 相连 的 程度 。 


我 认识 一 个 人 , 而 他 认识 一 个 曾经 为 美国 总 统 工作 的 家 伙 。 世界 真 小 , 不 是 吗 ? 我 不 是 说 我 
有 令 人 得 意 的 关系 网 , 但 我 离 这 个 自由 世界 的 领袖 只 有 两 个 握手 的 距离 。 在 你 被 震惊 之 前 ,你 应 
该 知道 ， 你 离世 界 上 几乎 任何 人 可 能 只 是 几 个 联系 之 隔 。 

任何 两 个 人 都 在 六 度 分 隔 理论 内 ， 这 可 能 是 真实 的 ， 这 个 神奇 旦 经 常 被 引用 的 数字 6 实际 上 
来 自 于 一 个 真正 的 科学 研究 ! 这 里 有 一 些 巧 妙 的 研究 方法 , 向 你 揭示 连接 我 们 所 有 人 的 无 形 关系 ， 
或 者 至 少 让 你 和 鸡尾酒 会 中 的 另 一 些 人 有 连接 关系 。 
























































6.12.1 六 度 分 隔 理论 


有 一 个 作品 叫 《 六 度 分 隔 》( Six Degrees of Separation )， 作 者 是 约翰 格 尔 ， 威 尔 . 史密斯 
主演 了 改编 自 此 作品 的 同名 电影 。 还 有 一 种 流行 的 派对 益 智 问答 游戏 ， 有 时 也 被 称 为 “ 凯 文 * 贝 
肯 的 六 度 ”， 即 尝试 通过 一 系列 的 电影 和 其 他 表演 去 连接 任何 男 演员 或 女 演员 ， 直 到 他 们 与 演员 
凯 文 * 贝 肯 有 共同 的 连接 。 

这 个 短语 和 概念 来 自 一 项 对 小 世界 问题 的 研究 。 你 是 否 曾 经 在 一 次 聚会 上 或 一 间 咖 啡 厅 里 和 
陌生 人 聊天 ， 然 后 发 现 你 们 都 认识 同样 一 个 人 ? 社会 心理 学 家 斯 坦 利 . 米尔 格 兰 姆 在 20 世 纪 60 
年 代 末 ( 当时 比 现在 有 更 多 的 鸡尾酒 会 ) 就 对 这 种 现象 很 好 奇 。 社 交 网 络 中 有 多 少 关系 重 肆 ? 如 
果 我 们 都 聚 在 一 起 ,， 列 出 我 们 认识 的 每 一 个 人 ,总 会 有 某 种 连接 吧 ? 也 许 , 从 自身 的 熟人 关系 网 
的 中 心 出 发 , 随 着 我 们 越 来 越 往外 探索 ,最 终 我 们 会 发 现 自己 几乎 和 每 个 人 都 一 定 的 联系 。 但 是 
那 需要 多 少 连 接 呢 ? 

只 有 一 度 分 隔 意味 着 我 们 都 彼此 认识 。 嗯 ， 我 不 认识 你 〈 无 意 冒 犯 )， 所 以 我 们 知道 ， 如 果 
要 连接 所 有 人 ， 一度 分 隔 太 少 了 。 会 不 会 只 有 两 度 分 隔 ?” 如果 我 们 彼此 不 认识 对 方 , 没准 我 们 有 
一 个 共同 的 朋友 ? 

所 以 问题 是 : 在 你 和 其 他 任何 人 之 间 有 多 少 度 的 分 隔 ? 为 了 得 到 答案 , 使 用 本 Hack 的 方法 进 
行 一 个 大 的 或 小 的 研究 。 










































































6.12.2 ”做 一 个 大 研究 


怎样 才能 研究 我 们 是 否 真 的 生活 在 一 个 小 世界 里 这 个 问题 呢 ? 最 好 的 办 法 是 复制 斯 坦 利 ， 米 
尔格 兰 姆 使 用 的 方法 。 
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1. 选择 一 个 目标 

米尔 格 兰 姆 住 在 马萨诸塞 州 的 波士顿 , 他 最 开始 选择 了 一 位 他 认识 的 、 在 本 地 工作 的 人 。 米 
尔格 兰 姆 希望 建立 的 最 终 链 接 的 末端 ， 不 是 凯 文 ， 贝 骨 ， 而 是 一 位 同意 作为 目标 的 股票 经 纪 人 。 
你 可 以 挑选 你 最 好 的 朋友 或 你 所 在 学 校 的 校长 ， 或 你 所 在 大 学 的 校长 。 但 是 ,首先 你 要 获得 他 们 
的 许可 (一些 关 于 伦理 的 东西 )。 

2. 招募 被 试 

然后 ,米尔 格 兰 姆 随机 从 两 个 社区 抽样 : 波士顿 和 内 布 拉 斯 加 州 的 奥马 哈 。 采取 这 种 抽样 方 
案 是 为 了 代表 任意 一 个 人 认识 目标 的 可 能 性 的 两 个 极端 。 从 附近 的 人 和 远 距离 的 人 开始 , 他 们 的 
数据 平均 值 应 该 非常 具有 总 体 代表 性 。 米 尔格 兰 姆 使 用 了 300 个 随机 选择 的 被 斌 人员。 你 应 该 在 
时 间 和 花费 的 允许 范围 内 招募 尽 可 能 多 的 人 。 

3. 训练 被 试 

米尔 格 兰 姆 以 邮件 形式 给 每 个 被 坛 人 员 邮 寄 了 一 个 小 包 右 。 该 包 右 包含 了 研究 说 明 以 及 一 封 
给 波士顿 经 纪 人 的 信 。 说 明 要 求 他 们 把 那 封 信 交 给 我 们 的 股票 经 纪 人 , 但 只 有 当 他 们 直接 认识 他 
时 才能 把 那 封 信 给 他 。 如 果 他 们 不 直接 认识 他 ， 就 被 要 求 记录 一 些 信 息 ， 如 他 们 的 名 字 , 并 把 这 
个 包 右 寄 给 某 个 他 们 自己 认识 的 、 更 有 可 能 认识 经 纪 人 的 人 。 那些 在 链接 里 的 下 一 波 人 收 到 了 同 
样 的 带 有 说 明和 信 的 包 右 。 如 果 他 们 认识 经 纪 人 ，, 那么 他 们 可 能 已 经 把 信 交 给 了 经 纪 人 ,或 者 把 
已 寄 给 了 链接 中 的 第 三 链接 ， 等 等 。 

在 你 自己 的 研究 中 , 一 定 要 明白 、 清 楚 地 编写 说 明 , 还 有 ,现在 你 可 能 要 为 这 个 研究 的 合法 
性 作出 解释 ,告诉 大 家 这 不 是 一 个 商业 游说 ,也 不 是 连锁 信 ( 我 猜 尽 管 它 的 字面 意思 就 是 连锁 信 )， 













































































所 有 考虑 到 的 免责 条 款 都 对 你 有 所 帮助 。 如 果 有 人 质疑 这 个 项 目的 合法 性 , 你 还 应 该 附 上 自己 的 
联系 信息 。 


4. 收集 和 分 析 结 果 

经 过 一 段 合 理 的 时 间 后 ,你 和 目标 人 联系 ， 并 收集 所 有 收 到 的 信件 。 在 每 封 信里 ， 数 出 形成 
链接 的 名 字 个 数 。 计 算 所 有 不 同 长 度 链接 的 平均 值 ， 以 确定 典型 的 链接 数量 。 找 出 涵盖 最 大 链接 
数 的 最 小 数字 ， 这 样 你 就 有 最 大 的 距离 。 

在 米尔 格 兰 姆 的 研究 中 , 波士顿 目标 人 最 终 收 到 约 100 封 信 。 其 中 , 链接 的 平均 数 是 6, 因此 ， 
“六 度 分 隔 ” 中 的 数字 六 起 源 于 此 。 

但 是 请 注意 ， 并 非 所 有 信件 都 成 功 到 达 ， 所 以 我 们 无 法 从 这 个 研究 中 得 出 6 是 真正 的 正确 数 
字 。 这 项 研究 也 只 是 在 美国 进行 而 已 ,并 没有 在 全 世界 范围 内 开展 ， 所 以 地 球 上 任意 两 人 之 间 只 
有 几 度 分 隔 的 宏伟 观点 是 基于 哲学 的 ， 而 不 是 基于 经 验 的 。 
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尔格 兰 姆 对 服从 有 所 了 解 。 在 进行 小 世界 研究 前 的 几 年 里 ,米尔 格 兰 姆 就 可 能 因 另 
一 个 巧妙 的 研究 而 大 众 所 知 ,这 个 巧妙 的 研究 有 更 令 人 不 安 的 结果 。20 世 纪 60 年 代 ， 
早期 米尔 格 兰 姆 的 服从 研究 证 明 ， 当 有 权力 的 人 (如 穿着 实验 室外 套 的 研究 助理 ) 
要 求 研究 被 试 做 一 些 让 他 们 不 舒服 的 事情 时 ， 如 给 予 (或 让 他 们 相信 正在 给 予 ) 另 
一 个 被 试 以 电击 ,会 这 么 做 的 人 数量 多 到 惊人 。 对 于 为 什么 有 人 会 在 即使 他 们 不 认 
同 的 情况 下 “服从 命令 ”这 一 问题 ， 米 尔格 兰 姆 的 研究 有 很 大 的 启示 。 


ww 考虑 到 对 被 试 的 复杂 要 求 ， 米 尔格 兰 姆 拥有 非常 高 的 响应 率 。 这 并 不 奇怪 ， 因 为 米 


两 个 最 近 的 研究 已 证 实 ， 社 交 网 络 中 ， 人 与 人 之 间 的 平均 连接 数 约 为 6 或 更 少 。 


6.12.3 ”做 一 个 小 研究 

有 很 多 使 用 这 些 方 法 却 不 花费 太 多 力气 的 方式 。 这 个 活动 的 目标 可 以 是 科学 求证 , 也 可 以 只 
是 为 了 派对 的 乐趣 。 

1. 使 用 电子 邮件 

复制 米尔 格 兰 姆 的 研究 , 但 利用 电子 邮件 的 便利 性 。 在 这 里 ,问题 变 成 了 : 使 用 电子 邮箱 进 
行 联系 ， 人 与 人 之 间 的 连接 数 为 多 少 。 电 子 邮 件 比 缓慢 的 邮局 邮件 更 有 效 ， 而 且 几 乎 没有 成 本 。 

当然 , 通过 电子 邮件 选择 被 试 可 能 更 困难 。 很 难 随机 选择 电子 邮件 地 址 ， 因 为 没有 一 本 大 的 
类 似 电话 短 的 列表 以 供 我 们 从 中 采样 .此 外 , 你 发 送 的 电子 邮件 可 能 被 误 认 为 垃圾 邮件 并 遭 忽 略 。 
顺便 说 一 句 ， 因 为 你 的 研究 兴趣 是 正当 的 ， 你 不 必 担 心 会 违反 任何 互联 网 协议 。 

2. 着 眼 于 聚会 

当 举 办 大 型 晚会 时 ( 如 果 这 是 一 个 鸡尾酒 宴会 , 米尔 格 兰 姆 会 非常 喜欢 , 这 是 他 最 初 的 灵感 
来 源 )， 给 你 的 宾客 散发 资料 。 给 他 们 每 人 一 张大 的 索引 卡片 和 一 支 笔 。 每 张 卡片 的 底部 都 列 出 
了 参加 聚会 的 某 个 宾客 的 名 字 。 如 果 客 宾 不 认识 卡片 下 方 列 出 的 那个 人 , 他 应 该 在 卡片 上 方 签 上 
自己 的 名 字 ， 并 把 它 交 给 其 他 某 个 自己 认识 且 可 能 认识 卡片 下 面 列 出 的 那个 人 的 人 。 

这 一 进程 应 继续 下 去 , 就 像 在 米尔 格 兰 姆 的 研究 中 一 样 ,直到 卡片 到 达 列 在 底部 的 人 的 手 里 ， 
那 人 便 把 卡片 上 交 。 晚 会 结束 时 ， 你 可 以 分 析 数 据 并 向 你 的 宾客 证 明 他 们 真 的 都 相互 认识 。 
















































































6.12.4 只 做 数学 计算 

但 是 ,即使 没有 科学 研究 ,一 个 快速 的 数学 分 析 也 可 能 说 服 你 ,让 你 相信 你 和 其 他 人 之 间 的 
人 数 是 相当 小 的 一 个 数字 。 你 知道 多 少 人 的 名 字 ? 100? 200? 比方 说 ， 大 约 是 100。 据 推测 ， 他 
们 每 个 人 也 都 大 约 知道 100 个 人 的 名 字 ， 所 以 你 只 通过 两 度 分 隔 就 已 经 连接 到 10 000 个 人 了 。( 实 
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际 上 ， 算 上 你 认识 的 一 度 分 隔 的 100 个 人 ,总 计 是 10 100 人 。 ) 在 你 连接 到 一 大 堆 的 人 之 前 不 需要 





太 多 的 度数 ， 如 表 6-21 所 示 。 


表 6-21: 分 隔 度 和 相应 的 连接 
分 隔 度 连 接 





1 100 

2 10 000 

3 1 000 000 

4 100 000 000 

5 10 000 000 000 


了 


事实 上 ， 通 过 短 短 五 度 分 隔 ， 你 就 应 该 能 连接 100 亿 人 ， 比 地 球 总 人 口 还 多 ! 
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那么 , 为 什么 现实 中 , 真正 连接 上 所 有 人 需要 更 多 的 连接 数 呢 ? 问题 是 人 与 人 之 间 的 、 由 100 
个 熟人 构成 的 组 群 不 是 相互 独立 的 。 你 有 100 个 朋友 ， 他 们 每 个 人 的 百人 朋友 圈 并 不 是 完全 不 同 














的 。 你 比较 熟悉 的 100 个 人 中 ， 有 相当 一 部 分 比例 的 人 也 存在 于 其 他 人 的 朋友 列表 中 。 


社交 网 络 中 有 很 多 的 重合。 这 种 重 全 实际 上 有 助 于 增加 你 和 附近 的 人 ( 比如 在 同一 国家 ) 产 





生 直 接 联系 的 几率 。 





祖父 母 悖 论 

和 网 络 重 登 类 似 的 问题 是 祖父 母 悖 论 。 你 有 一 对 父母 。 你 的 父母 各 自 有 一 对 父母 ,这 样 你 
就 有 4 个 祖父 母 。 每 个 祖父 母 有 一 对 父母 和 4 个 祖父 母 。 无 需 往 上 数 很 多 代 ，, 你 就 能 得 到 数量 巨 
大 的 人 数 。 

数 到 40 代 祖父 母 , 你 需要 一 万 亿 人 .这 比 有 史 以 来 曾经 生活 在 地 球 上 的 所 有 人 的 总 和 还 多 。 
而 这 只 发 生 在 近 千 年 。 从 哪里 得 到 这 些 多 出 来 的 祖父 母 ? 也 许 是 木星 ? 

当然 ,答案 是 : 这 一 过 程 中 一 定 存 在 遗传 树 上 的 重 登 。 有 时 ， 一 些 有 血缘 关系 的 人 也 会 结 
婚 并 生 和 孩子 。 出 于 礼貌 ， 我 猜测 他 们 是 第 二 代 堂 兄妹 ， 或 诸如 此 类 的 关系 。 

















米尔 格 兰 姆 使 用 的 小 世界 技术 , 已 经 在 各 种 社交 网 络 的 研究 中 被 认为 非常 有 用 。 几 度 分 隔 的 


概念 有 一 个 直观 的 吸引 力 ， 因 为 它 让 我 们 觉得 我 们 都 是 一 个 小 社区 的 一 部 分 。 





每 次 我 们 通过 某 个 共同 朋友 找到 和 一 个 陌生 人 的 连接 ， 这 种 感觉 都 会 被 加 强 。 我 不 认识 你 ， 
但 在 我 自己 的 世界 里 ,我 是 如 此 重要 以 至 于 我 可 以 轻松 地 把 自己 和 各 种 著名 人 物 连 接 起 来 。 例 如 ， 
20 世 纪 80 年 代 初 , 我 是 堪萨斯 州 劳 伦 斯 市 堪萨斯 大 学 的 一 名 大 学 生 , 同时 在 美国 广播 公司 制作 的 
影 《 明 日 之 后 》( The Day 4fier ) 中 做 临时 演员 ,这 是 一 部 广 受 好 评 的 电影 ， 讲 述 美国 核 战 后 的 
各 种 可 能 性 。 约 翰 . 利 特 高 在 《明日 之 后 》 里 饰演 一 名 科学 教授 ,他 随后 出 现在 影片 《浑身 是 劲 》 





































































































( Footloose ) 中 ， 主 演 就 是 凯 文 * 贝 肯 先生 ! 毕竟 ， 这 是 一 个 小 世界 。 
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6.12.5 参阅 


口 最 近 两 个 证 实 六 度 或 更 少 的 分 离 度 的 研究 在 《今日 心理 学 》( Psychology Today ) 上 刊登 的 
“六 度 分 隔 ” 一 文中 有 摘 述 ， 作 者 是 达 比 ， 萨克斯 比 (Darby Saxbe )， 发 表 于 2003 年 11 月 /12 
月 一 期 o 

口 Watts, D.J. (2003). Six degrees. New York: Norton. 一 本 关于 网 络 新 科学 的 书 ， 提 供 对 我 们 生 
活 的 连接 时 代 全 面 且 引人入胜 的 探讨 ， 其 中 包括 六 度 分 隔 的 概念 。 

















J 6.13 驾驭 投票 循环 
#73 虽 狼 自由 选举 似 伴 是 制定 政策 选 举 官员 最 公平 、 最 明智 的 系统 ,但 统计 学 家 有 时 担 
心 被 政治 学 家 称 为 “投票 循环 ”的 悖 论 ， 该 屠 论 可 能 会 导致 少 效 群体 获胜 。 有 一 种 
更 好 的 方式 来 进行 选举 。 


当 我 还 是 一 个 小 小 “统计 学 家 ”时 ， 我 的 父母 偶尔 会 让 我 对 自己 的 事情 作出 选择 : 穿 什么 、 
吃 什 么 、 睡 前 读 哪 本 故事 书 ， 等 等 。 我 注意 到 ， 有 时 候选 择 是 开放 式 的 :“ 你 自己 选择 ,布鲁斯 。 
你 打算 什么 时 候 去 睡觉 ? ”, 有 时 候选 择 以 一 组 选项 的 形式 出 现 , 我 要 从 中 作出 选择 :“ 你 自己 选 
择 ， 布鲁斯 。 你 想 现在 睡觉 还 是 五 分 钟 后 睡觉 ? ” 

当然 , 第 二 个 选择 称 不 上 是 一 个 选择 , 真 的 。 当 我 必须 从 不 同 的 备 选 方案 中 进行 选择 时 ,我 
的 真实 想法 不 如 我 可 以 任意 选择 想 要 的 东西 时 反映 得 那样 准确 。 

民主 就 像 这 样 。 当 投票 选举 总 统 、 市 长 ,或 捕 狗 人 时 , 我 们 通常 要 在 几 个 备 选 方案 之 间 进 行 
选择 。 我 们 可 能 对 任何 选项 都 不 满意 ,但 无 论 如 何 我 们 都 投票 了 ( 至 少 统计 学 家 这 么 做 )。 但是， 
在 离开 投票 间 时 , 你 是 否 曾经 感觉 那些 选择 在 某 种 程度 上 不 能 完全 代表 你 自己 的 真实 想法 ?政治 
学 家 知道 那 种 感觉 。 他 们 分析 了 对 备 选 方案 都 不 其 满意 时 的 情况 , 发 现在 这 种 情况 下 作出 选择 可 
能 会 导致 没 人 满意 的 结果 ( 当然 赢家 除外 )。 




















































































































6.13.1 投票 循环 


选举 的 构成 可 以 有 多 种 方式 。 试 想 一 下 , 一 个 选民 ( 如 一 个 城市 居民 、 俱 乐 部 会 员 , 或 大 学 教 
员 ) 被 要 求 表 决 一 项 政策 , 他 有 3 种 选择 。 男 外 ,想象 有 3 组 支持 者 ,每 组 支持 者 对 其 中 一 种 意见 的 
俩 爱 胜 于 其 他 两 种 意见 。 这 次 选举 可 能 要 求人 们 投票 选 出 他 们 最 喜欢 的 政策 。 在 这 个 系统 下 , 受 最 
大 的 群体 青睐 的 政策 很 可 能 会 赢得 最 多 的 选票 。 这 似乎 是 公平 的 ,这 也 是 我 们 最 常 看 到 的 选举 系统 。 

男 一 个 合理 的 系统 ( 至 少 表面 上 是 合理 的 ), 会 呈现 每 对 对 立意 见 , 有 对 决 选举 的 味道 , 其 中 A 
和 B 对 比 、B 和 C 对 比 、C 和 A 对 比 。 在 这 种 系统 下 , 最 大 投票 获得 者 的 产生 应 该 是 非常 公平 的 。 但 是 ， 
事实 证 明 ， 这 种 称 为 投票 循环 的 系统 ， 很 难 公平 地 使 用 ， 因 为 你 展示 的 选项 顺序 能 决定 选举 结果 ! 
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所 选举 中 的 投票 循环 和 你 如 何 安 排 篮球 联赛 的 原理 一 样 : 比赛 的 顺序 可 能 会 影响 获胜 
结果 。 


6.13.2 ”如 何 生效 
以 下 是 投票 循环 如 何 生 效 的 一 个 例子 。 试 想 一 下 ， 你 的 童子 军需 要 决定 将 部 队 俱乐部 内 部 
(或 任何 童子 军 集会 的 地 方 ) 粉刷 成 什么 颜色 。 作 为 群体 一 员 ， 你 要 投票 给 红色 、 白 色 或 蓝 色 。 
不 同 的 政治 “团体 ”已 经 在 你 的 喜欢 不 同 颜色 的 同事 中 形成 了 。 
有 偏好 红色 的 苹果 队 ， 有 喜欢 白色 的 大 象 队 ， 有 钟爱 蓝 色 的 松 鸦 座 队 。 至 于 第 二 喜欢 的 颜色 
和 最 不 喜欢 的 颜色 ， 这 些小 组 也 有 不 同意 见 。 表 6-22 给 出 了 3 个 组 和 他 们 的 政治 议程 。 











表 6-22: 粉刷 偏好 与 政治 观点 




















组 选民 百分比 第 一 选择 第 二 选择 第 三 选择 
苹果 组 20% 红 白 蓝 
大 象 组 40% 白 蓝 红 
松 鸦 鹰 组 40% 蓝 红 白 


要 确定 童子 军 的 意愿 ， 你 可 以 举行 一 个 两 阶段 的 选举 。 第 一 阶段 提出 两 个 备 选 方案 。 这 个 阶 
段 的 获胜 者 随后 与 第 三 种 备 选 方案 “竞争 "， 挑 选 一 个 赢家 。 两 阶段 选举 及 其 结果 可 能 看 起 来 如 下 
所 示 。 

( 红色 还 是 白色 ? 参照 表 6-22， 红 色 可 能 会 得 到 60% 的 选票 , 淘汰 了 白色 。 现 在， 获胜 者 去 
和 蓝 色 竞争 。 

(2) 红色 还 是 蓝 色 ? 在 这 个 对 决 中 ， 红 色 得 到 20% 的 选票 ， 蓝 色 以 80% 的 巨大 支持 率 获胜 。 

因此 ， 蓝 色 的 油漆 一 定 是 大 家 的 意愿 ! 但 是 ， 这 是 一 个 悖 论 结 果 ， 因 为 只 有 一 个 组 最 喜欢 蓝 
色 ， 其 人 数 占 童 子 军 总 数 的 40%。 同 等 数量 的 童子 军 最 喜欢 白色 ， 而 另外 20% 的 人 讨厌 蓝 色 。 决 
策 的 顺序 影响 了 结果 。 让 我 们 以 不 同 的 顺序 再 做 一 次 。 

(1) 红色 还 是 蓝 色 ” 蓝 色 以 80% 的 选票 获胜 。 

(2) 蓝 色 还 是 白色 ? 白色 以 60% 的 选票 赢得 这 场 比赛 。 

因为 对 决 的 顺序 不 同 ,， 我们 得 到 了 不 同 的 结果 。 这 是 有 趣 的 ， 让 我 们 再 做 一 次 。 也 许 这 次 我 
们 可 以 安排 让 红色 获胜 。 

(1) 蓝 色 还 是 白色 ? 在 这 场 与 蓝 色 的 对 决 中 ， 白 色 将 获得 60% 的 选票 存活 下 来 。 

(2) 白色 还 是 红色 ? 红色 以 60% 的 多 数 选 票 赢 得 这 场 比赛 。 干 得 好 ， 红 色 。 红 色 分 明 就 是 大 家 
最 喜欢 的 颜色 ! 


3 种 可 能 的 对 决 顺序 导致 3 种 完全 不 同 的 政策 决定 。 
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6.13.3 ”摆脱 投票 循环 


如 果 我 们 把 投票 系统 看 做 测量 系统 , 那么 这 种 做 决策 的 对 决 方法 具有 很 低 的 效 度 。 在 这 里 丢 
失 了 原本 可 能 收集 到 的 选民 信息 。 但 是 ， 现 在 我 的 脑海 中 浮现 出 很 多 种 解决 循环 投票 问题 的 
方法 。 

如 果 投 票 系 统 的 设计 者 对 选民 的 顺序 偏好 感 兴趣 ， 可 以 要 求 选民 对 所 有 候选 人 进行 等 级 排 
序 。 平 均等 级 最 低 者 获胜 (将 最 偏爱 的 一 位 排 为 等 级 一 )。 这 是 一 个 使 用 了 所 有 可 用 信息 且 更 公 
平 的 方法 ,但 这 将 导致 没有 人 为 最 终结 采 激动 不 已 。 

















ww 例如 ， 多 年 前 这 样 的 系统 导致 了 我 家 身 名 上 昭著 的 决定 : 我 们 平安 夜 的 电影 是 《小 鬼 
当家 》( Home Alone )。 





另 一 种 解决 方案 是 给 所 有 候选 人 提供 一 张 选票 ,票数 最 多 者 获胜 。 这 是 最 常用 的 系统 , 但 当 
所 有 候选 人 都 没 获得 大 多 数 人 的 支持 时 ， 这 种 系统 确实 有 缺点 。 

对 于 有 很 多 候选 人 的 选举 ( 比如 ， 某 些 市 长 或 省 长 选举 )， 经 常会 有 一 个 对 决 ， 在 对 决 中 ， 
大 量 的 候选 人 被 前 减 到 一 个 较 小 的 数目 。 这 没有 投票 循环 的 缺点 , 因为 所 有 的 候选 人 在 同一 时 间 
都 被 考虑 到 了 。 它 也 消除 了 单 向 投票 方法 的 缺点 ， 因 为 它 增加 了 受 大 多 数 人 支持 的 候选 人 获胜 的 
可 能 性 。 





| WN 5714 在 快车 道上 生活 (你 已 经 在 了 ) 
和 运 过 应 用 几率 以 及 对 人 性 的 认识 ,还 有 一 些 基于 高 速 公路 辑 驶 行为 的 事实 ,你 可 以 作 
出 更 明知 的 变 道 类 策 。 


没有 什么 比 堵 在 路 上 更 令 人 泪 形 了 , 尤其 当 其 他 车 移动 得 比 你 快 时 。 虽然 往 快速 车 道上 变 道 
很 有 吸引 力 ， 但 事实 证 明 ， 你 的 判断 可 能 是 错误 的 ， 另 一 条 车 道 也 许 真 的 不 比 你 的 车 道 快 。 


不 应 该 变 道 时 却 决 定 变 道 , 这 是 一 个 危险 的 决定 。 不 仅 多 数 的 车 辆 碰撞 事故 是 由 错误 驾驶 导 
致 的 ， 而 且 美 国 每 年 发 生 300 000 起 车 辆 事故 ， 尤 其 常 发 生 在 司机 变换 车 道 时 。 当 然 ， 如 果 你 赶 
时 间 且 你 旁边 车 道上 的 车 比 你 开 得 更 快 , 只 要 你 能 安全 变 道 , 一 个 明智 的 司机 为 什么 不 移动 到 快 
车 道上 去 ? 毕 尝 ,正如 我 已 经 耐心 地 向 法 院 机 关 解 释 了 很 多 次 一 样 :“ 好 ”司机 不 一 定 是 更 安全 
的 司机 ; 他 只 是 能 够 尽 可 能 快 地 到 达 目 的 地 的 司机 。 

问题 是 , 最 近 基 于 计算 机 模拟 的 统计 研究 表明 , 司机 通常 会 判断 另 一 条 车 道 移动 得 比 他 们 的 
更 快 ， 即使 它们 实际 上 是 以 相同 的 速度 在 移动 ! 调查 研究 显示 ,这 种 误解 足以 让 大 多 数 司 机 试图 
向 其 他 车 道 变 道 。 
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6.14.1 跳 过 、 错 过 以 及 时 期 


在 一 条 繁忙 的 高 速 公 路 上 ,或 交通 堵塞 时 , 我 们 的 感官 世界 是 由 我 们 面前 的 大 卡车 、 我 们 左 
右 两 侧 能 看 到 的 汽车 ,以 及 墙 在 我 们 后 面 可 怜 的 傻瓜 构成 的 。 判 断 我 们 的 行车 速度 时 ,虽然 我 们 
有 一 个 速度 表 ， 但 最 引 人 注 目的 数据 往往 来 自我 们 两 侧 车 道 的 汽车 。( 是 它们 超 了 我 们 还 是 我 们 
超 了 它们 ? ) 

交通 研究 人 员 把 你 超过 其 他 车 辆 的 时 刻 称 为 跳 过 ( skip ), 把 其 他 车 辆 超过 你 的 时 刻 称 作 错过 
( slip )。 最 近 的 研究 把 跳 过 称 为 超车 时 期 ， 把 错过 称 为 被 超车 时 期 。 相 比 被 超车 时 期 ， 司 机 非常 
喜欢 超车 时 期 ， 这 可 能 不 会 令 你 感到 惊讶 。 






































.< 一 个 时 期 是 一 段 时 间 。 交 通 繁忙 时 ， 司 机 在 路 上 的 驾驶 时 间 本 质 上 是 由 一 系列 很 短 
的 持续 时 间 构 成 的 。 




















除了 寻找 要 进入 的 更 快车 道 ， 司 机 还 有 一 个 目标 ， 那 就 是 让 自己 的 车 保持 尽 可 能 快 的 速度 ， 
或 者 至 少 接近 目标 速度 ( 比如 ， 可 能 是 接近 限 速 水 平 的 速度 )。 如 果 感 觉 自 己 和 前 方 车 辆 有 一 定 
的 距离 , 并且 自 己 目前 尚未 以 目标 速度 移动 , 那么 司机 会 加 速 以 缩小 差距 。 正 是 这 些 突然 的 加 速 
形成 了 跳 过 ( 超过 其 他 车 的 时 期 ) 和 错过 ( 被 其 他 车 超过 的 时 期 )。 相 比 我 们 超过 别 的 车 辆 ， 当 
我 们 被 其 他 车 辆 超过 时 , 我 们 可 能 体验 到 更 多 的 时 间 间 隔 。 正 是 这 种 感知 上 的 不 公正 导致 司机 推 
断 他 们 是 在 慢车 道上 ， 即 使 两 个 车 道 都 一 样 的 缓慢 。 

想象 一 下 ， 两 条 并 排 车 道 以 相同 的 平均 速度 移动 。 汽 车 之 间 间 距 的 形成 具有 随机 性 ; 更 准确 
地 说 , 它们 的 形成 具有 系统 性 , 但 是 基于 一 个 随机 的 起 始 配 置 。 间距 形成 的 同时 , 间距 也 被 填补 ; 
间距 被 填补 的 同时 ， 汽 车 也 在 加 速 。 




















一 条 车 道 的 平均 速度 可 以 用 车 辆 行驶 距离 除 以 行驶 时 间 来 计算 。 所 以 ， 如 果 两 条 车 
道上 的 车 辆 均 5 分 钟 开 了 1000 码 ,那么 它们 具有 同样 的 每 分 钟 200 码 的 平均 速度 ,或 
每 小 时 6.8 英 里 。 


在 拥挤 的 公路 上 , 偶尔 有 机 会 供 司机 尝试 缩小 间距 , 但 实际 上 , 缓慢 移动 或 不 移动 所 花费 的 
时 间 更 多 ( 相对 而 言 )。 在 缓慢 移动 时 ， 侦 尔 会 有 其 他 车 道 的 汽车 填补 间 际 ， 并 超过 那些 暂时 在 
慢车 道上 的 司机 ， 当 然 ， 这 需要 更 多 的 时 间 。 

按时 期 来 测量 时 ， 对 于 任何 一 个 司机 而 言 ， 被 超车 的 时 间 将 比 超车 的 时 间 要 更 多 。 这 是 因为 
你 是 在 快速 移动 时 超过 其 他 车 辆 的 ， 而 在 缓慢 移动 时 被 超车 。 图 6-9 展 示 了 这 种 感知 。 
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图 6-9: 感知 被 超车 的 时 间 


当 发 现 其 他 车 辆 在 加 速 填补 间距 ,而 我 们 却 依然 静止 不 动 时 , 就 形成 了 我 们 的 车 道 移动 得 更 
慢 的 错觉 。 


6.14.2 ”概率 与 交通 模式 


通过 进行 计算 机 模拟 来 确定 司机 对 其 他 车 道 速度 感知 的 准确 性 ， 加 拿 大 研究 人 员 唐 纳 德 ， 雷 
迈 德 (Donald Redelmeier ) 和 罗伯特 托 比 希 赖 ( Robert Tobshirani ) 对 基于 正 态 分 布 特征 [Hack 
#23] 的 交通 模式 提出 了 一 些 假 设 。 

在 拥挤 的 高 速 公 路 上 ， 有 几 个 原因 〈 如 条 件 、 出 入 口 等 ) 能 形成 间距 ， 为 了 反映 这 个 现实 ， 
他 们 基于 两 个 正 态 分 布 在 移动 车 辆 间 随 机 分 配 间隔 : 90% 的 间隔 为 相距 2 米 左 右 , 加 减 0.1 米 ; 10% 
的 间隔 为 相距 100 米 ， 加 减 5 米 。 在 数 百 次 模拟 的 最 开始 ， 车 辆 和 间距 都 遵循 这 种 随机 计划 被 放置 
和 创造 。 

研究 人 员 创 建 以 相同 速度 向 同一 方向 行驶 的 两 条 车 道 的 数据 , 他 们 想象 出 了 数 百 个 有 典型 加 
速 和 制 动 能 力 的 车 辆 。 它 们 以 这 样 一 种 安全 驾驶 策略 运行 当 车 道上 有 间距 时 ,它们 就 会 往 前 移 
动 ,但 不 能 靠 得 太 近 。 这 些 模拟 司机 不 允许 过 于 靠近 其 他 车 辆 的 后 挡 板 。 此 外 , 也 允许 车 辆 改变 
车 道 ， 这 一 定 令 电脑 控制 的 司机 诅 丧 。 这 里 没有 事故 。 












































以 平均 加 速度 和 制 动 速度 模拟 他 们 的 车 辆 ， 雷 迈 德 和 托 比 希 赖 选择 典型 的 统计 指标 
(在 10 秒 内 起 步 加 速 到 63 英 里 /小 时 的 能 力 和 在 5 秒 从 63 英 里 /小 时 减速 到 0 的 能 力 )， 
这 恰好 和 本 田 雅 阁 的 参数 匹配 。 


6.14.3 ”作出 明智 的 变 道 决策 
雷 迈 德 和 托 比 希 赖 发 现 13% 的 时 间 ， 汽 车 要 么 超车 要 么 正 被 超车 。 大 多 数 时 候 , 汽 车 行驶 的 
速度 彼此 相当 。 任 意 特定 的 司机 被 超车 的 几率 比 他 正在 超车 的 几率 更 高 ， 当 他 超车 时 ,他 超过 了 
一 堆 汽 车 。 数 学 运算 得 出 ， 被 超车 的 汽车 和 超车 的 汽车 数量 差不多 。 被 我 们 的 司机 超过 的 汽车 总 
数 等 于 超过 他 的 汽车 数量 
在 拥挤 的 公路 上 驾驶 时 ,大 部 分 时 间 里 另 一 条 车 道 似乎 都 更 畅通 。 有 一 些 方法 来 处 理 这 样 的 
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误解 并 作出 更 明智 的 (和 统计 安全 ) 驾驶 选择 : 

D 作为 一 名 有 录 避 的 科学 家 ， 你 可 以 通过 旅程 的 长 度 来 评估 你 的 驾驶 ， 而 不 是 通过 你 是 否 记 

得 了 堵车 比赛 来 判断 。 如 果 你 认为 与 其 他 车 道 相 比 ， 有 更 多 的 车 超过 了 你 ， 也 没有 关系 。 

D 记 住 其 他 车 道 更 好 这 个 误解 ， 并 寻找 更 好 的 方法 来 判断 其 他 车 道 的 速度 。 选 择 另 一 条 车 
道上 的 一 辆 车 ， 几 分 钟 后 对 比 你 和 它 的 位 置 。 毕 竞 ， 有 时 会 有 一 些 更 快 的 车 道 , 但 你 不 
能 把 超过 你 的 车 辆 当做 速度 的 最 佳 证 据 。 

D 在 大 型 公路 上 ， 远 离 左 侧 或 右 侧 将 有 出 口 的 车 道 ， 因 为 车 辆 驶 出 或 驶 入 道路 ， 是 减速 和 

加 速 的 主要 原因 。 

D 无 论 驾驶 还 是 购买 汽车 ， 都 要 遏制 你 的 冲动 。 有 趣 的 是 ， 仿 真 结果 表明 ， 冲 动 的 驾驶 ， 如 
最 小 化 你 和 另 一 辆 车 之 间 的 距离 ， 实 际 上 会 增加 你 注意 到 其 他 车 辆 超过 你 的 时 间 。 此 外 ， 
更 快 的 汽车 ( 那 此 能够 迅速 加 速 的 ) 会 花 更 少 的 时 间 超过 其 他 汽车 ， 因 为 它们 可 以 更 忆 
地 做 到 这 一 点 。 所 以 ， 你 的 超级 动力 跑车 可 能 导致 你 在 拥挤 的 公路 上 遭受 更 多 的 捧 折 。 

要 处 理 以 为 男 一 条 车 道 速度 比 你 的 车 道 速度 快 这 个 可 能 的 误解 , 最 明智 的 策略 也 许 也 是 最 简 

单 策略 ， 即 只 要 不 去 注意 它 。 仿 真 结果 表明 ， 如 果 你 查看 其 他 车 道 的 时 间 缩减 一 半 ， 那 你 发 现 汽 

车 超过 你 的 时 间 也 减 半 。 

但 是 我 认为 我 们 并 不 需要 统计 分 析 来 告诉 我 们 这 一 点 。 不 要 想 你 旁边 的 车 , 要 更 多 地 注意 你 


后 面 的 车 。 你 已 经 遥遥 领先 它们 了 ， 它 们 有 成 千 上 万 辆 呢 。 你 已 经 赢得 了 堵车 比赛 。 










































































6.14.4 ”参阅 

口 Redelmeier D.A. and Tibshirani, R.J. (1999). “Why cars in the next lane seem to go faster.” 

Nature, 401, 35. 最 初 的 研究 报告 基本 涵盖 了 本 文 的 交通 分 析 。 

口 Redelmeier, D.A. and Tibshirani, R.J. (2000). “Are those other drivers really going faster?” 
Chance, 13, 3, 8-14. 上 述 《 自然》 杂志 上 的 文章 有 对 结果 更 详尽 的 描述 。 
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i 字 多 】 搜索 外 星 主 命 非常 监 行 。 你 可 以 使 用 统计 抽样 和 梳 座 聚焦 于 搜索 。 

对 于 和 其 他 星球 的 生命 进行 通信 这 一 科学 追求 ,我 们 需要 作出 判断 。 首先， 必须 判断 除了 我 
们 自己 的 星球 上 (我 的 是 地 球 ， 你 的 是 什么 ? ) 有 生命 ,其 他 星球 是 否 存在 生物 。 二 是 必须 确定 
如 何以 及 在 哪里 找到 它们 。 你 可 以 使 用 统计 方法 来 做 这 两 个 判断 。 






































6.15.1 估计 智能 行星 的 数目 
1961 年 ， 弗 兰 克 “' 德 雷 克 ( Frank Drake )， 一 位 对 通过 读 取 无 线 电波 (一 大 堆 一 直 由 地 球 反 
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射 ) 观察 宇宙 遥远 处 感 兴趣 的 天 文学 家 决定 估计 可 能 存在 多 少 种 技术 先进 的 文明 。 
以 我 们 小 小 的 银河 系 为 中 心 , 他 最 感 兴趣 的 是 确定 在 我 们 的 银河 系 中 , 地 球 附近 究竟 有 多 少 
种 先进 文明 ( 愿意 并 能 够 与 我 们 交谈 的 行星 )。 德 雷 克 给 出 了 这 个 等 式 : 
银河 系 中 的 文明 数 = (R)CN,(R)(F)(F.)(Z) 
表 6-23 显 示 了 德 雷 克 方 程 中 各 缩写 的 含义 。 


表 6-23: 德 雷 克 等 式 构成 

术语 含 义 

银河 系 中 新 恒星 诞生 的 速率 (每年) 

环绕 每 颗 可 以 支持 生命 的 恒星 的 平均 行星 数 
能 够 孕育 生命 的 (从 N, ) 行星 比例 
能 够 孕育 智慧 生命 (从 鳌 ) 的 行星 比例 
能 够 发 展 文明 (从 五 ) 的 行星 比例 
文明 (从 Ff. ) 的 平均 寿命 (年 ) 














之 宛 


| 














下 





这 个 计算 公式 真 的 只 是 一 个 概率 链 。 预 期 的 积极 结果 由 所 有 单独 的 可 能 性 相 乘 确定 。 不 包含 
这 些 F 变 量 的 公式 更 简单 而 且 效 果 也 不 错 ， 将 这 些 特定 的 不 同 部 分 纳入 其 中 ， 能 帮助 科学 家 们 确 
定 当 估 算 我 们 并 不 孤单 的 概率 时 ， 所 需 回答 的 重要 问题 。 











6.15.2 ”应 用 德 雷 克 方 程 

为 了 计算 我 们 的 银河 系 中 目前 存在 智慧 生命 的 真实 星球 数 , 你 必须 代入 一 些 真实 的 数字 。 男 
外 ， 我 们 知道 正确 答案 (方程 的 解 ) 一 定 至 少 为 1， 因 为 地 球 上 有 智慧 生命 (在 这 里 插入 你 自己 
的 笑话 )， 而 且 一 定 不 会 超过 恒星 ( 可 能 支持 生命 ) 周围 的 平均 行星 数 的 230 000 000 000〈 银河 
系 中 恒星 的 数目 ) 倍 。 

当 第 一 次 引入 这 个 公式 时 ， 天 文学 家 公认 只 有 一 个 变量 可 以 估计 。 那 就 是 R， 即 我 们 的 银河 
系 每 年 新 产生 的 恒星 数 ， 这 个 数字 被 认为 大 约 是 10。 


























所 如 果 20 世 纪 60 年 代 R 被 认为 是 10， 我 想 现在 我 们 银河 系 恒 星 的 正确 数量 将 接近 2500 
亿 +40。 


1980 年 ， 天 文学 推广 者 卡尔 萨 根 (Carl Sagan )， 在 他 的 电视 节目 以 及 同名 书 《 宇 宙 》 
( Cosmos ) 中 讨论 了 德 雷 克 方 程 。 因 为 我 们 对 自己 太阳 系 的 行星 了 解 甚 少 ， 而 且 ， 更 重要 的 是 ,我 
们 对 其 他 太阳 系 ( 哪怕 有 这 样 的 事情 ) 的 行星 一 无 所 知 , 所 以 萨 根 对 每 个 值 的 估计 以 及 他 的 最 佳 猜 
测 答 案 都 是 具有 推测 性 的 ， 但 他 的 回答 是 ， 在 任意 特定 时 间 ， 银 河 系 中 都 约 有 600 万 行星 拥有 能 够 
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和 我 们 沟通 的 技术 。 

根据 我 们 今天 所 掌握 的 知识 ， 表 6-24 提 供 了 一 组 可 以 产生 一 个 可 能 答案 的 值 。 这 些 值 取 自 
2005 年 10 月 《天 体 生物 学 杂志 》( 4stropiology Magazine ) 上 的 一 篇 文章 ， 作 者 是 纽约 大 学 的 史 带 
芬 . 索 特 博士 〈 可 能 你 的 咖啡 桌 上 就 有 一 本 )。 在 某 些 情况 下 ， 我 从 索 特 提供 的 系列 值 中 选择 了 
一 个 确切 的 值 。 























表 6-24: 德 雷 克 方 程 的 应 用 








项 估计 计算 

R 每 年 10 个 10 

N, 0 .01 (100 个 恒星 中 有 1 个 行星 ) 10 x 0.01=0.10 

nh 1 (以 地 球 为 代表 ) 0.10 x 1=0.10 

已 0.001 ( 索 特 提出 的 “小 分 数 ”) 0.10 x 0.001=0.0001 
F. 0.20 0.0001 x 0.20=0.000 02 
L 100 000 年 0.000 02 x 100 000=2 











有 了 这 些 数字 , 公式 估计 ,在 整个 银河 系 中 能 相互 通信 的 行星 数量 总 共 是 两 颗 。 地 球 是 其 中 
的 一 个 。 那 另外 一 个 是 哪个 ? 

正如 萨 根 、 索 特 以 及 其 他 作者 指出 的 那样 ,在 我 们 的 银河 系 中 , 在 任何 给 定时 间 能 支持 高 等 
生命 的 星球 数量 取决 于 很 多 随意 估计 的 因素 , 输入 数值 时 , 任何 一 个 小 的 选择 都 能 极 大 地 改变 结 
果 。600 万 个 可 能 的 朋友 和 只 有 2 个 可 能 的 朋友 , 这 两 者 有 着 重要 的 区 别 , 但 两 者 的 估计 都 来 自 合 
理 的 假设 集 。 

当 你 对 方程 每 个 部 分 尝试 不 同 的 估计 时 , 请 注意 方程 的 解 是 如 何 变 化 的 。 如 果 大 多 数 智慧 生 
物 ( 比方 说 80% ) 最 终 会 产生 文明 ， 那 么 可 能 行星 的 数量 变 为 8。 对 于 能 够 支持 生命 的 恒星 ， 如 
果 其 周围 的 平均 行星 数 实际 上 是 2( 如 萨 根 所 建议 )， 我 们 的 8 颗 行星 将 变 成 1600 颗 行星 。 

索 特 表示 , 不 同 的 合理 估计 能 产生 几 千 种 的 答案 ; 另 一 方面 , 受 限于 我 们 自身 的 无 线 电能 
也 可 能 产生 如 此 少 的 答案 , 表现 出 统计 上 的 不 可 能 性 , 以 至 于 我 们 成 为 成 十 上 万 的 星系 中 唯一 的 
先进 文明 。 


























6.15.3 ”寻找 我 们 的 空间 密友 

德 雷 克 方程 的 一 个 可 能 的 结果 是 : 在 我 们 的 银河 系 中 , 只 有 两 颗 行 星 具 有 能 够 发 送 和 接收 无 
线 电波 的 高 等 智慧 文明 。 如 果 我 们 真 的 只 有 一 个 潜在 的 宇宙 笔友 , 那么 在 如 此 多 的 行星 里 将 会 很 
难 找到 他 或 它 。 那 么 ， 该 怎么 办 ? 

目前 寻求 新 生命 、 新 文明 的 策略 是 用 微波 接收 器 扫描 天 空 。 无 线 电信 号 有 广泛 的 频谱 。 有 一 
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些 频 谱 是 自然 存在 的 , 有 些 则 属 特别 窗 的 范围 , 被 认为 只 能 人 工 创造 , 比如 从 《三 人 行 》( Three’s 
Company ) 电视 节目 或 者 通过 雷达 传输 的 频谱 。 那些 寻 找 外 星 生命 的 人 格外 关注 属于 人 工 光 谱 的 
过 号 ， 他 们 和 希望 发 现 并 分 离 出 先进 文明 的 随机 输出， 当然 ,这 也 可 能 是 任何 有 兴趣 的 观测 者 基于 
利益 而 故意 发 出 的 信号 广播 。 















































如 果 你 有 一 批 属 于 自己 的 微波 监听 电台 ，, 就 会 想 把 它们 调 至 利于 发 现 其 他 星球 生命 
的 频率 : 1.42 千 兆赫 。 任 何 天 然 的 信号 源 都 不 可 能 在 该 频率 发 射电 波 。 


不 过 , 天 空 很 辽阔 ,研究 人 员 使 用 既 有 针对 性 又 具 便 利 性 的 抽样 技术 来 确定 寻找 区 域 。 搜 索 
策略 专注 于 满足 两 个 条 件 的 恒星 亚 群 : 
口 它们 是 与 我 们 的 太阳 有 共同 特征 的 恒星 ; 
口 它们 在 附近 (距离 地 球 只 有 100 光 年 )。 








6.15.4 数据 分 析 


如 果 能 发 出 关键 生命 信号 的 行星 数量 非常 少 ( 如 德 雷 克 方 程 中 显示 的 数字 )， 那 么 这 样 的 样 
本 搜索 必须 是 非常 彻底 的 ; 否则 ,我 们 可 能 会 错过 它 。 统 计 学 家 们 把 这 种 情形 的 研究 归 为 , 需要 
一 个 很 大 的 统计 检验 力 [Hack #8]， 因 为 效应 值 是 如 此 之 小 。 

扫描 天 空 时 有 如 此 多 的 数据 被 收集 起 来 ,以 至 于 没有 人 ,其 至 没有 计算 机 能 成 功 分 析 它 。 你 
能 获得 帮助 ! SETI@home 是 伯克利 大 学 的 一 个 基础 项 目 ， 安 排 人 员 定 期 用 普通 家 庭 或 办 公 室 电 
脑 接收 一 些 数据 , 所 以 当 他 们 没有 做 别 的 事情 时 ,他们 的 计算 机 可 以 对 数据 进行 分 析 。SETI 是 的 
Search for Extraterrestrial Intelligence ( 搜寻 外 星 文明 ) 的 缩写 。 该 项 目 就 像 一 个 屏幕 保护 程序 ， 
你 可 以 在 http:/setiathome.berkely.edu 免 费 下 载 。 


当 你 得 到 这 些 数据 时 , 这 些 数据 对 你 没有 任何 意义 , 但 你 的 电脑 会 使 用 统计 分 析 对 信号 的 信 
息 进行 排序 ， 寻 找到 能 说 明 问 题 的 、 非 随机 的 、 罕 带宽 的 、 可 能 意味 着 另 一 个 星球 已 经 成 熟 到 能 
产生 《傻子 派 尔 》( Gomer Pyle ) 或 《飞跃 情 海 》( Melrose Place ) 此 类 电视 剧 的 信息 。 你 可 能 是 
第 一 个 发 现 其 他 星球 生命 的 人 ， 所 以 去 工作 吧 ! 
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